多领域对话系统的错误恢复策略与交互质量评估
多领域对话系统错误恢复策略评估
在多领域对话系统中,错误恢复策略至关重要。研究对四种对话策略进行了评估,参与者共99人(71男/28女),平均年龄30.4岁。他们对语音对话系统(SDS)有一定经验,且普遍具有一定技术亲和力。
- 评估指标与参与者情况
- 评估了四项可用性得分:各策略评分、四种策略对比、各样本交互评分、样本交互对比,采用重复测量方差分析(ANOVA)进行比较。
- 近95%的参与者正确理解了任务,验证了视觉任务描述方法的有效性。
- 对话策略评估(假设1)
- 可用性方面 :各策略可用性得分差异显著,REF策略评分最高,AU策略最差,DLS和DC策略处于中间水平,且DC策略严重依赖上下文。
- 任务成功率方面 :REF和DLS策略的任务成功率很高,用户几乎总能达成目标。在REF_GS_withoutCtx中,部分用户忽略明确确认步骤,导致任务成功率低于其他变体。AU策略的开放式问题对新手用户效果不佳,但如果用户了解应用如何响应请求,可能会对其有更高评价。
- 上下文信息的运用(假设2)
- 在DLS和DC中,上下文影响应用顺序;在AU中,任务类型(动作和信息检索任务)有所变化。
- DLS在任务成功率和可
超级会员免费看
订阅专栏 解锁全文
943

被折叠的 条评论
为什么被折叠?



