25、开放域对话中通过候选重排增强自我表露

开放域对话中通过候选重排增强自我表露

1. 引言

基于神经语言预训练的神经语言模型,如 GPT、GPT - 2 等,推动了自然语言处理(NLP)各下游任务的发展。在开放域对话建模领域,像 DialoGPT、Blender - bot 和 Meena 等模型在单轮对话中展现出了不错的性能。然而,这些深度学习模型生成的对话回复虽与人类之前的表述相关,但往往很快就会让人类失去兴趣,陷入琐碎的对话,产生诸如“谢谢”“好的”“我不知道”等平淡且重复的回复。

出现这种情况的一个原因是,神经对话系统缺乏明确的对话策略。自我表露作为一种重要的社交策略,在心理学研究中被证明有助于建立对话双方的关系,提高对话参与度。本文旨在通过一种新颖的模型适配方法,增强现有的神经对话代理,使其能够激活自我表露。

2. 自我表露

人类在对话中会采用多种对话策略以实现多个目标。对话策略是一种话语单元,通常比言语行为更大,能跨越多个对话回合,有助于在对话中建立和维护人际关系。其中,自我表露是最重要的对话策略之一。

社会渗透理论(SPT)认为,两人之间的交流随着关系的发展会从浅层向深层推进,而这一过程主要通过自我表露实现。自我表露是指一个人向他人透露自己的信息,如想法、愿望、过去的事件和未来的计划等,有助于建立融洽的关系和相互信任。研究表明,在人机对话中运用自我表露能提高对话满意度。

2.1 自我表露(SD)等级

自我表露可分为多个等级,本文采用社会科学和心理学文献中提到的三个等级:
- G(一般) :无自我表露,回复内容是关于第三人、事件或事物的,被标记为一般表露。
-

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值