科学研究

讲座预告 | “词与世界 · Word & World”外国语言文学文化系列讲座第三十四期

日期: 2025-05-08



第三十四期 大语言模型汉语语言能力评测与语言习得研究


主讲人:胡海

上海交通大学外国语学院

助理教授、硕士生导师

主持人:要新乐

中国人民大学外国语学院

英语系副教授

时间:2025年5月13日(周二)19:00-20:30

腾讯会议: 297-643-321


主讲人介绍

胡海,博士,上海交通大学外国语学院助理教授,硕士生导师。2021年获美国印第安纳大学计算语言学博士学位(辅修认知科学)。获中国人民大学英语语言文学本科、硕士学位。 研究方向为:计算语言学、自然语言处理、大语言模型、认知科学。在Computational Linguistics等计算语言学、语言学权威期刊发表论文多篇,在ACL, AAAI, EMNLP, COLING等自然语言处理及人工智能顶会发表论文多篇。 主持教育部人文社科青年项目、上海市浦江人才计划项目。获2024年中国计算语言学年会亮点论文奖。


讲座介绍

如今的大语言模型貌似出口成章,它们是否真的理解日常对话中的言外之意?它们又是如何习得汉语语法的?本次报告将从两个方面探究大语言模型的汉语能力。第一部分将以模型语言能力评测为主,通过建立包含成语、代词脱落、旁格结构等的汉语推理评测集,以及以格莱斯合作原则为理论基础的《武林外传》言外之意评测集, 探究早期预训练模型如BERT以及大语言模型如GPT的汉语理解能力。第二部分则以模型汉语语法习得为研究对象,通过构造包含100多种句法语义现象的汉语语法现象评测集ZhoBLiMP,以及从零训练不同参数量、数据量的汉语语言模型,探究模型汉语语法的习得顺序、习得条件、习得曲线,是否有难以习得的语法现象。最后,讨论大语言模型的成功对语言学的启示,以及未来研究方向。


主办单位

中国人民大学外国语学院

 

编辑:高梓闻 张亦如