某中心在EMNLP 2021发表的23篇论文
自然语言理解与问答是关注的重点领域,其余主题范围涵盖从自学习到文本摘要。
会议背景
EMNLP 2021
在即将于下周举行的自然语言处理实证方法会议(EMNLP)上,某中心研究人员将展示23篇论文。其中大部分集中在两个主题上:自然语言理解(即文本的语义解释)和问答系统。这两项技术对包括某智能助手、某云计算服务和某电商平台在内的各项业务至关重要。其余10篇论文涵盖了一系列主题,包括自学习、信息检索、语言建模和机器翻译。
自然语言理解研究
在此领域,某中心研究人员将一系列技术——如半监督学习、少样本学习和对比学习——应用于各种子问题。例如:视觉指代表达识别(识别图像中自然语言表达式所指的对象);共指消解(确定不同术语是否指向同一实体);以及处理分布偏移(推理时数据分布与训练集分布不匹配)。
涉及的具体论文包括:
- 《反事实赌博学习中多领域口语理解的反馈归因》
- 《MetaTS:用于最少监督下多语言序列标注的元师生网络》
- 《注意上下文:在基于神经模块网络中进行视觉指代表达识别的语境化影响》
- 《用于跨语言分类的最近邻少样本学习》
- 《ODIST:通过分布偏移实例进行的开放世界分类》
- 《句子表征的成对监督对比学习》
- 《顺序跨文档共指消解》
问答系统研究
某中心在问答系统方面的工作包括:帮助对话式AI代理在与客户互动时建议后续问题;过滤无法回答的问题以防止浪费系统资源;以及少样本学习。
涉及的具体论文包括:
- 《使用可微分知识图谱的端到端实体解析与问答》
- 《在可微分知识图谱上使用交集扩展端到端问答》
- 《FewshotQA:使用预训练文本到文本模型的问答任务少样本学习框架》
- 《通过可微分奖励模仿学习生成自包含且以摘要为中心的问题-答案对》
- 《这个问题会被回答吗?通过答案模型蒸馏进行高效问答的问题过滤》
- 《基于参考的弱监督:使用网络数据进行答案句子选择》
其他研究领域
- 公平性:某云计算服务研究人员在一篇关于减轻机器翻译模型中性别偏见的论文中探讨了公平性问题(《GFST:用于更准确翻译性别的性别过滤自训练》)。
- 信息检索:某中心的论文研究了对话式搜索的集成模型,以及识别产品评论中可能误导读者对评论者情感判断的反事实声明(《用于在线购物的端到端对话式搜索与话语转移》、《我希望我会喜欢这个,但我没有:一个用于产品评论中反事实检测的多语言数据集》)。
- 语言建模:两篇论文探讨了为自然语言处理模型近期成功做出巨大贡献的语言建模类型(《语言模型需要多少预训练数据来学习语法?》、《使用最优传输作为多语言上下文嵌入微调的对齐目标》)。
- 机器翻译:某智能助手研究人员结合数据混合和弹性权重巩固,改进了机器翻译模型对新任务的适应能力(《改进神经机器翻译多领域适应的质量权衡》)。
- 复述生成:通过改变句子表层形式同时保留语义内容来生成复述,有助于为其他自然语言处理任务扩充训练数据(《学习选择性学习以进行弱监督复述生成》)。
- 自学习:利用隐式反馈信号自动改进机器学习模型,无需人工干预(《一个可扩展的框架:利用隐式用户反馈改进大规模对话式AI系统中的自然语言理解》、《用于减少对话系统摩擦的上下文重述检测》)。
- 文本摘要:一篇来自某云计算服务的新论文考虑了在对话语境下进行文本摘要所面临的特殊问题(《对话摘要的技巧集锦》)。
欲了解更多关于某中心在EMNLP的参与情况,请参阅我们对某云计算服务应用科学家、EMNLP机器学习领域主席的采访。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

435

被折叠的 条评论
为什么被折叠?



