纠错与提取方法比较
1. 引言
在对话中,纠错是至关重要的,因为错误和歧义难以避免。例如,当一个家用机器人收到“把清洗好的勺子放进餐具抽屉”的指令时,它可能不清楚具体哪个抽屉是餐具抽屉。若它选错抽屉,用户就需要进行纠正,如“不,放进水槽右边的抽屉”。或者,机器人也可以直接询问用户餐具抽屉的位置,用户的回答就起到了纠错的作用。
此外,当用户改变初始指令,或者系统因自动语音识别或自然语言理解错误而误解用户请求时,也会产生纠错的需求。
我们提出了一个组件,它以请求和纠错信息作为输入,输出纠正后的请求。该组件仅专注于替换实体短语,如“水槽右边的抽屉”,而动词短语等其他类型的短语不在本研究范围内。
例如,请求“把清洗好的勺子放进餐具抽屉”,加上纠错信息“不,放进水槽右边的抽屉”,会被转换为“把清洗好的勺子放进水槽右边的抽屉”。
这种纠错组件相较于直接在主对话组件中处理纠错有两个优势:一是减少了对话组件所需的训练数据量,因为如果有一个开放领域的纠错组件,就无需学习纠错;二是可以输出待修正实体和修正实体的对,这些实体对可用于对话系统的终身学习组件,减少未来纠错的需求,让机器人学习到具体哪个抽屉对应餐具抽屉。
2. 前期研究
在交互式修复对话领域,已有多项研究。例如,有研究采用多模态方法,用户可以通过重新表述、拼写、从自动语音识别组件的 n - 最佳列表中选择替代项或手写来指出并纠正错误短语。还有研究通过考虑上下文来增强纠错策略,并在听写系统中对这些方法进行了评估。
也有研究提出基于纠错语法的错误处理组件,但需要基于语法的对话系统;还有研究提出纠错检测模块和处理检测到的错误的策略。此外,一些研
超级会员免费看
订阅专栏 解锁全文
22万+

被折叠的 条评论
为什么被折叠?



