ACL首届博士论文奖公布，华人学者李曼玲获荣誉提名

原创已于 2025-07-30 14:04:46 修改 · 581 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能 #科技 #多模态 #语言模型

于 2025-07-30 14:03:30 首次发布

科研前沿速递专栏收录该内容

77 篇文章

订阅专栏

来源：公众号计算机科研圈

自然语言处理顶会 ACL 公布了今年的一个特别奖项 —— 计算语言学博士论文奖。

这个奖项是今年新增的，获奖者是来自美国华盛顿大学的 Sewon Min。她的博士论文题为「Rethinking Data Use in Large Language Models（重新思考大型语言模型中的数据使用）」。

ACL 大会官方表示，「Min 的论文对大型语言模型的行为和能力提供了关键见解，特别是在上下文学习（in context learning）方面。其研究成果对当今自然语言处理的核心产生了影响。

Sewon Min 本科毕业于首尔大学，2024 年在华盛顿大学拿到博士学位，现在在加州大学伯克利分校电气工程与计算机科学系（EECS）担任助理教授。Google Scholar 上的数据量显示，她的论文被引量已经过万。

除了这篇获奖论文，ACL 大会官方还公布了三篇计算语言学博士论文奖提名，获奖者分别为伊利诺伊大学香槟分校博士李曼玲、华盛顿大学博士 Ashish Sharma 和爱丁堡大学博士 Thomas Rishi Sherborne。

以下是获奖论文的详细信息。

ACL 计算语言学博士论文奖

获奖论文：Rethinking Data Use in Large Language Models

作者：Sewon Min
机构：华盛顿大学
链接：https://www.sewonmin.com/assets/Sewon_Min_Thesis.pdf

在这篇论文中，作者讨论了她在理解和推进大型语言模型方面的研究，重点关注它们如何使用训练所用的超大规模文本语料库。

首先，她描述了人们为理解这些模型在训练后如何学习执行新任务所做的努力，证明了它们所谓的上下文学习能力几乎完全由它们从训练数据中学到的内容决定。

接下来，她介绍了一类新的语言模型 —— 非参数语言模型（nonparametric LM）—— 它们将训练数据重新用作数据存储，从中检索信息以提高准确性和可更新性。她描述了她在建立此类模型基础方面的工作，包括首批广泛使用的神经检索模型之一，以及一种将传统的两阶段 pipeline 简化为一个阶段的方法。

她还讨论了非参数模型如何为负责任的数据使用开辟新途径，例如，通过分离许可文本和版权文本并以不同方式使用它们。最后，她展望了我们应该构建的下一代语言模型，重点关注高效 scaling、改进事实性和去中心化。

ACL 计算语言学博士论文奖提名

ACL 会议表示「在众多杰出的投稿中选出优胜者十分困难 —— 因此委员会推荐三位表现同样出色的论文获得特别提名」，在这里我们也将选择一篇优秀的论文展示给读者。

论文 1：Event-Centric Multimodal Knowledge Acquisition

作者：Manling Li
机构：伊利诺伊大学香槟分校（UIUC）
链接：https://www.ideals.illinois.edu/items/128632

「发生了什么？是谁？什么时候？在哪里？为什么？接下来会发生什么？」是人类在面对海量信息时理解世界所需回答的基本问题。

因此，在这篇论文中，作者聚焦于多模态信息抽取（Multimodal Information Extraction, IE），并提出以事件为中心的多模态知识获取方法（Event-Centric Multimodal Knowledge Acquisition ），以实现从传统的以实体为中心的单模态知识向以事件为中心的多模态知识的跃迁。