对话行为的增量识别与预测
1 引言
在对话处理领域,准确识别对话行为对于理解对话意图和生成合适回应至关重要。传统方法在处理未分割的口语对话时存在一定局限性,而基于机器学习的增量识别方法为解决这一问题提供了新的思路。本文将介绍一种结合局部和全局分类器的方法,用于对话行为的增量识别,并探讨其优势和应用前景。
2 局部分类器的局限性
局部分类器在处理对话行为识别时,会根据输入的局部特征做出预测。然而,这些预测可能存在错误,且一旦做出决策就不会再重新评估。例如,在处理一些具有歧义的语句时,局部分类器可能会做出不准确的判断。
以“garden - path”现象为例,人类在解释话语时会根据后续信息修正之前的判断,但局部分类器缺乏这种灵活性。因此,仅依靠局部特征进行决策是不够的,需要结合更广泛的上下文信息。
3 全局分类器的引入
为了克服局部分类器的局限性,引入了全局分类器。全局分类器不仅考虑输入数据的局部特征,还将所有局部分类器的部分输出作为特征。具体操作步骤如下:
1. 训练局部分类器,获取每个输入的可能输出预测。
2. 选择五个先前预测的类标签作为特征,因为长距离依赖可能很重要,且数据中功能段的平均长度为 4.4 个标记。
3. 训练全局分类器,将局部特征和先前预测的输出作为输入。
以下是使用全局分类器对 AMI 和 Map Task 数据进行分类的 F - scores 和 DERsc 概述(基于五个先前标记的预测):
| 分类 | AMI 数据 - BayesNet | AMI 数据 - Ripper | Map Task 数据 - BayesNet |
超级会员免费看
订阅专栏 解锁全文
637

被折叠的 条评论
为什么被折叠?



