录播视频地址:AIS 2022丨ACL-IJCAI-SIGIR顶级会议论文报告会回放视频公开啦
智源官网活动主页,有详细议程的介绍:ACL-IJCAI-SIGIR顶级会议论文报告会(AIS 2022)
本文关注5月14日的对话和生成部分。主要内容是截图slides,并附注一些讲解内容。比我之前写cs224w和李宏毅的笔记会简略很多,在图中不言自明的内容我就不另附介绍了。
1. 前沿趋势报告2:AIS2022对话与生成研究概述
哈尔滨工业大学张伟男

选择了一些代表性文章
AIS 2022




ACL 2022







state tracking(domain的slot)


串联为pipeline


IJCAI 2022



SIGIR 2022



当前会话、用户历史信息、相似用户





2. Session 3:Dialog and Generation(对话和生成)
1. AdaLoGN
南京大学厉肖



蕴涵关系

由已知关系推到出其他关系的过程→对图上结构的扩展

四选一

初始构建图
句法规则(否定,如动词互为反义词)

神经+符号推理
roberta→token平均值
图扩充







2. 结合任务对话和开放域对话的语料集
百度徐俊






黄色部分:知识型对话
问答对话

语料集



The PLATO-MT Model with Prompt-based Mechanism

DuClarifyDial as a New Benchmark




3. 问题生成
复旦大学


彩色是要求的答案,模型需要学会提问
本文针对multi-hop问题生成:


关系图
实体能够保证问题深度(美国总统妻子是什么职业)

当前实体是否必须出现在问题中(flag)





4. 预训练模型里的隐变量
复旦大学陈伟





未来预测策略:可以让解码器有更好的规划能力


KL loss:假设原来是正态分布,最小化分布差值
free bits:KL loss达到一定阈值后才开始优化
BOW loss:隐变量直接非自回归地预测词汇,希望隐变量能够包含response信息


先在reddit-short上用比较大的batch size做预训练,再在reddit-long上用比较小的batch size做预训练

同时增加相关性BLEU和多样性distinct(一般不能同时)


5. 检索式对话
复旦大学陈伟

本文聚焦在第一阶段,有大量response,抽取

检索效率



正例:有相同response
对比损失







6. 线上陪伴型机器人、情感对话
小米李嫣然
6.1 MISC




应该指的是2021年清华的这篇:Towards Emotional Support Dialog Systems
询问情况,推理背景信息,做疏导

常识知识库
comet模型:常识生成模型,输入situation,推理出情绪状态、需求

knowledge-enhanced context representation
选择策略的分布,和矩阵相乘,得到mixed stragy representation

上述论文是这篇




长句子的混合策略
只需要原有的监督信号
6.2 C 3 K G C^3KG C3KG
常识+对话


应该选择什么知识来辅助理解对话



单轮对话,标注情感和意图

event的转折


6.3 HICR
纯文本安抚→富媒体/多模态


玩游戏、听歌


基于用户信息进行推荐




7. COSPLAY
北京工业大学徐晨

7.1 背景



7.2 动机
保持一致性的同时给对方表达更多persona的机会

7.3 模型
强化学习
鼓励提问



迫使模型围绕共同话题聊天
7.4 实验与分析



紫色表示模型对自身的关注,暗色表示对对方的

8. 中立语句演示原因
信工所李江楠


缺点是缺乏对情绪信息的使用













聚类预测




该博客总结了AIS2022会议中关于对话和生成的研究,涉及AdaLoGN模型、任务与开放域对话融合、问题生成、预训练模型中的隐变量、检索式对话以及情感对话等。内容涵盖各领域的最新进展,包括模型设计、语料集、实验分析和未来研究方向。
503

被折叠的 条评论
为什么被折叠?



