讲座回顾|“词与世界”系列讲座第34期——大语言模型汉语语言能力评测与语言习得研究
日期: 2025-05-19
5月13日晚,由中国人民大学外国语学院主办的“词与世界·Word & World”外国语言文学文化系列讲座第34期在线上顺利举行。本次讲座以“大语言模型汉语语言能力评测与语言习得研究”为主题,特邀上海交通大学外国语学院助理教授胡海博士主讲。讲座由人大外国语学院英语系副教授要新乐主持。
胡海博士结合其在Computational Linguistics、ACL、AAAI、EMNLP、COLING等国际期刊和会议上发表的研究成果,深入剖析了当前大语言模型在汉语理解与语法习得方面的研究发现。
讲座中,胡海博士回顾了AI与NLP发展——从早期难解语义的Siri,到2022年中文NLP模型追平人类水平,他指出,其背后核心是数据、算法、算力的提升,其中大规模语料和高质量评测集尤为关键。他深入浅出地阐释了Transformer框架、GPT自监督预训练、有监督微调与人类反馈强化学习机制。围绕大语言模型的中文能力,他介绍了包含成语、代词脱落、旁格结构等特征的汉语推理评测集,以及格莱斯合作原则为理论基础的言外之意评测集,用以对比早期预训练模型和大语言模型的汉语理解能力。胡海博士通过图灵测试的演进、发展与挑战,阐明了高质量微调数据能显著提升跨语言迁移效果。他以模型——人类学习差异、大模型U形学习曲线现象和关键期假设为例,揭示了从头预训练语言模型对模型习得过程研究的意义,并展望了中文评测与数据建设的未来方向。
互动环节中,师生围绕模型泛化能力、跨语言迁移实践、机器翻译中的言外之意等问题进行了热烈讨论。胡博士鼓励同学们结合个人兴趣与社会需求,探索外语与人工智能交叉的新路径。本场讲座不仅为师生厘清了大语言模型在汉语评测和习得研究中的核心方法和挑战,也为外语专业学生的学术实践与个人发展提供了宝贵思路。
讲座完整视频链接:https://pan.baidu.com/s/1wvkzL4N0KeBt-w1ZdFKc8Q?pwd=9q94 (提取码: 9q94)
“词与世界·Word & World”外国语言文学文化系列讲座是我院着力打造的一项品牌活动,旨在通过通识讲座的形式来探讨外国语言文学文化领域中引人入胜的研究议题和现实问题,从而增强学生对学术研究的认识,培养学生的学术热情,提升学院科研文化氛围。欢迎各位老师和同学们持续关注!
撰稿:金紫菱
图片:金紫菱
编辑:张泽轶
审核:要新乐