基于词共现的对话代理统计话语选择方法
1. 引言
近年来,计算机化对话代理在各个领域得到了积极的研究和应用。不仅是像预订服务这样的任务导向型对话代理,像闲聊这样的非任务导向型对话系统也备受期待。此前,已经提出了一种使用隐马尔可夫模型来客观、定量评估非任务导向型对话代理的标准,这使得相对估计对话代理在自然交流中的能力成为可能。
为了创建一个能像脱口秀主持人一样激发对话的对话代理,需要解决两个问题:
1. 自动生成语音集合
2. 从语音集合中自动选择合适的反应
本文主要关注第二个问题,即基于对话伙伴的个人资料,从预先准备的语音集合中自动选择合适的回复。通过实现回复的自动选择,不仅可以实现对话代理,还能实现鼓励人类做出回应的代理。
许多基于机器学习的统计方法被提出用于解决在多个输入选项中选择合适答案的问题。例如,日语的依存句法分析,输入片段后,所有可能的片段对会被分类为“依存”或“非依存”,这是一个二元分类问题,决策树和最大熵方法等机器学习方法被认为是适用的解决方案。此外,还有一种偏好学习方法,可用于建模候选者的相对大小关系并对其进行排序。
本文提出了一种方法,对可能的话语进行相对大小关系建模并排序,以选择候选选项。首先定义话语选择问题,然后说明学习人类如何从可能的话语中进行选择的方法,最后通过实验验证该方法的有效性。
2. 候选话语的选择
- 定义 :在本文中,“话语”被定义为一次性陈述,“对话”被定义为从对话开始到结束的所有话语的有序集合。当对话在 s 处暂停时,定义候选集 $A_s = {a_{s1}, a_{s2}, …, a_
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



