交互式模式识别框架下的口语对话系统
1. 引言
在对话系统的研究中,将交互式模式识别(IPR)原理应用于口语对话系统(SDS)的管理是一个有前景的方向。目前,一些相关方法基于马尔可夫决策过程和强化学习,但由于全局优化是一个计算难题,该框架至今只能处理小规模问题,可通过状态空间分解和对话状态分布划分来解决。本文旨在将 IPR 原理应用于 SDS 管理,提出将 SDS 表示为 IPR 问题的新公式,并对 IPR 方法进行扩展,同时处理语音和基于文本的对话系统,定义基于 IPR 范式的用户模型,构建处理管理者和用户行为的初步图形模型,通过西班牙对话任务的初步评估,认为该公式是处理 SDS 的有前景框架。
2. IPR 框架下的口语对话系统
- 基本概念
- 设 (x) 为输入刺激、观察或信号,(h) 为假设或输出,经典模式识别(PR)系统需从 (x) 推导出 (h)。系统使用的模型 (M) 通常通过批量学习从给定训练对 ((x_i, h_i)) 获得。
- 在 IPR 框架下,用户提供反馈信号 (f),可迭代帮助系统改进假设,如图 1a 所示,这种交互考虑了人类反馈,可采用自适应在线程序。
- 决策理论视角
- 经过 (I) 次迭代,系统接收用户反馈 (F = f^1, f^2, \cdots, f^I) 并产生假设 (H = h^1, h^2, \cdots, h^I)。损失函数 (l(x, h, h^ , H, F)) 定义了系统因错误假设产生的成本,其中 (h^ </
超级会员免费看
订阅专栏 解锁全文

14

被折叠的 条评论
为什么被折叠?



