解码AIGC前沿趋势:厦门工学院第85期缘融论坛解锁多模态大模型应用新视界
作者:学院办公室 发表日期:2025/11/26 16:41:50
11月25日下午,厦门工学院第85期缘融论坛在正心大厦323顺利举办。本次论坛聚焦“AIGC与多模态大模型领域的技术趋势及应用”核心主题,特邀云知声智能科技股份有限公司AI Labs研发总监刘青松先生担任主讲嘉宾,为23级智能科学与技术专业学生及众多感兴趣的同学带来了一场兼具深度与广度的技术盛宴。
刘青松总监深耕人工智能领域多年,不仅拥有中国科学技术大学工学博士学位、UIUC访问学者经历,更主持参与多项国家级重大科研项目,在语音、视觉、多模态感知与生成技术等领域成果丰硕,曾在Interspeech、NeurIPS、CVPR等国际顶级会议发表论文十余篇,手握数十项相关专利,兼具深厚的学术积淀与丰富的产业实践经验。作为世界顶尖通用智能硬科技企业,云知声秉持“以通用智能,创造互联直觉的世界”的使命,构建了全栈AGI技术与产业化布局,其山海大模型(UniGPT)凭借“U+X”战略在智慧物联、智慧医疗等领域广泛应用,斩获北京市科技进步一等奖、吴文俊科技进步奖等多项殊荣,是国家级专精特新“小巨人”企业与人工智能领域的“国家队”成员。
分享中,刘青松总监从AIGC技术本质切入,系统解析了人工智能自动生成内容的核心逻辑与技术架构。他指出,AIGC作为迈向通用人工智能的重要应用领域,已实现文本、图像、音频、视频等多维度内容生成,其核心在于通过AI模型构建模态间的映射关系与信息建模预测。在技术原理层面,他详细拆解了LLM(大语言模型)基于Transformer架构的文本生成机制,Stable Diffusion模型驱动的文生图技术,以及云知声在国际语音合成大赛中斩获佳绩的语音合成技术,让在场同学直观理解不同模态生成的底层逻辑。
针对多模态大模型这一前沿方向,刘青松总监重点阐述了“以语言模型为枢纽的统一建模”理念,详解了预训练数据构建、模态语义对齐、下游任务指令微调三大核心流程,并通过语音大模型的零-shot生成、强时序建模等特性案例,展现了多模态技术在智能交互、数字人、身份识别等场景的应用价值。谈及技术趋势,他强调,Transformer架构的跨模态统一建模、Scaling Law驱动下的模型性能提升,以及细粒度模态对齐、数据隐私安全等方向,将成为未来 AIGC 与多模态大模型发展的核心焦点。
整场论坛干货满满,刘青松总监以专业的讲解、生动的案例,将复杂的技术原理转化为易懂的知识要点,不仅帮助同学们厘清了AIGC与多模态大模型的技术脉络,更让大家深刻洞察了该领域的产业应用前景。作为厦门工学院链接产业前沿与学术教育的重要平台,缘融论坛始终致力于为学生搭建与行业专家面对面交流的桥梁。此次论坛的成功举办,有效拓宽了同学们的技术视野,为其后续专业学习与职业发展提供了宝贵指引,也为学校人工智能领域人才培养注入了前沿动力。
素材来源|人工智能学院办公室
编辑 | 张浩
一审 | 叶诗菡 俞家伟
二审 | 赵芷仪
终审 | 谢志春