语音对话系统中多领域检测技术探究
1. 引言
在当今的科技领域,语音对话系统(SDS)成为了实现人机自然语言交互的重要工具。尤其是多领域语音对话系统(MDSDS),能够为众多领域提供对话服务,如餐厅指南、汽车导航、电影指南和电影票务等。MDSDS 工作时,首先要确定用户可能想要的领域,然后执行该领域特定的流程,包括自然语言理解、对话管理和响应生成。因此,从用户的话语中准确选择合适的领域是 MDSDS 的关键环节,若领域选择错误,会导致系统生成无意义的响应。
在实际应用中,领域的边界往往比较模糊。例如,当用户说“我计划去釜山”时,其意图可能涉及汽车导航、酒店预订,或者两者皆有。所以,为了提供准确的服务,MDSDS 需要具备从用户话语中同时检测多个领域的能力,这一任务被称为多领域检测(MDD)。
MDD 本质上是一个多标签分类问题,可通过组合领域内验证器(IDV)来解决。IDV 可以实现为一个基于正例和反例训练的二元分类器(BC)。然而,直接将目标领域的语料作为正例,其余领域的语料作为反例来训练 BC,可能会导致大量错误拒绝,因为其余领域的语料中包含一些属于目标领域的话语,实际上它们是未标记的例子,并非一定是反例。
为了解决 MDD 任务,采用了一种两步方法来仅从正例和未标记的例子中训练准确的 BC。第一步,自动从未标记的例子中识别可靠的反例;第二步,基于正例和第一步中识别出的可靠反例迭代训练 BC。
2. 相关工作
2.1 早期多领域检测方法
曾有人提出一种自动多领域标签标注方法,该方法使用人类设计的分层领域模型。它能根据先前标注的意图和命名实体自动为话语分配正标签和负标签,在小规模 MDSDS
超级会员免费看
订阅专栏 解锁全文
47

被折叠的 条评论
为什么被折叠?



