31、文本对话构建与系统评估全解析

文本对话构建与系统评估全解析

在对话系统构建领域,尽管已经取得了一定的成功,但训练数据的瓶颈问题仍然存在。在大多数问题领域,聊天机器人的设计者往往难以获取到质量和数量都符合要求的训练对话数据集。因此,他们不得不寻找替代的、质量较低的数据集,并应用诸如迁移学习等技术。然而,这样做的结果是,对话的相关性和连贯性常常不尽如人意。

1. 从文本构建对话的机制

我们发现了一种将各种风格和体裁的段落文本转换为对话形式的通用机制。具体来说,就是将段落拆分为文本片段,这些片段作为一组答案,然后从其中一些文本片段自动生成问题。将文本 T 构建为对话的问题可以表述为将其拆分为一系列答案 A = [A1…An],以形成对话 [A1, < Q1, A2 > , …, < Qn - 1, An >],其中 Ai 回答 Ai - 1 以及可能的先前问题,并且 ∪Ai = T。Qi - 1 需要通过语言手段和泛化从 Ai 的全部或部分内容中推导出来,有时还需要一些创造力,以使这些问题听起来自然。

对话生成与一般的内容(句子)生成问题有一定的关联,但问题应该比诸如神经序列到序列等方法可能生成的问题更具针对性。问题生成从一般的问答问题中分支出来,受到了越来越多的关注。其任务是根据答案和相应的文档生成自然语言问题。在众多应用中,问题生成已被用于改进问答系统。

对话从文本中形成遵循以下规则:一旦核心话语单元(nucleus EDU)结束,在卫星话语单元(satellite EDU)开始之前,插入针对该卫星 EDU 的问题。从文本作者和提问者之间的对话流程来看,提问者“打断”作者提出问题,使得卫星 EDU 以及可能的后续文本成为该问题的答案。这个问题应该是关于核心中的实体,但

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值