2025年11月1日,中国人民大学高瓴人工智能学院文继荣教授受邀莅临我院,在6A-519会议室以《大模型目前的几个关键问题》为主题作专题学术报告。我院相关专业师生参会,报告由我院院长牛宪华主持。
文继荣教授是人工智能领域资深专家,现任现任中国人民大学高瓴人工智能学院执行院长,曾任微软亚洲研究院高级研究员和互联网搜索与挖掘组主任。入选国家高层次人才计划、北京市卓越青年科学家计划等。长期从事人工智能领域的研究工作,至今已在国际著名学术会议和期刊上发表论文 500 余篇,论文总被引用 50000 余次,H-index 为 102。近年来专注大模型的研发,带领团队研发了第一个中文多模态大模型 “文澜”、有自主知识产权的 “玉兰” 系列大模型、第一个开源扩散大语言模型 LLaDA 等。担任中央统战部党外知识分子建言献策专家组成员、北京市第十四届政协常委等。

报告围绕大模型本质、里程碑、挑战及未来范式展开:提出“自然语言建模≈人脑建模”,详解“压缩即智能”“强化学习产生思考”两大里程碑,分析大模型与人类智能的差距并指出扩展定律、可靠性、成本三大挑战,重点介绍LLaDA的突破,证明扩散范式可替代自回归模型。

互动环节中,师生就“高熵token调控”、“LLaDA医疗适配”、“大模型幻觉解决”等提问,文继荣教授结合案例与实践解析,分享领域动态,为师生学术研究与职业发展提供启发,现场互动热烈。

此次报告搭建了顶尖专家交流平台,助力师生把握大模型核心逻辑与前沿趋势,对我院学科建设、课程优化及科研规划意义重大。未来我院将持续邀请名家开展交流,拓宽师生视野,推动学科融合,为AI人才培养与大模型技术发展奠基。