建设性对话建模:方法与评估
在对话技术不断发展的今天,系统评估和对话建模是两个至关重要的方面。系统评估有助于了解系统的性能和用户满意度,而对话建模则为自然语言通信提供了有效的方法和模型。
系统评估的多维度考量
系统评估涵盖了多个方面,包括手动评估和自动评估。手动评估依赖于人工准备,而自动评估则依据预定义的系统要求来评估系统的功能。然而,新兴的对话技术还需要从可用性和用户满意度的角度进行评估。
- 可用性评估 :一种常见的评估可用性的方法是采访用户,以确定他们对系统可用性的主观看法。在人机交互(HCI)研究中,可用性指的是系统易于使用、易于学习和易于交流。许多评估研究关注用户界面,而对对话能力的强调较少。例如,启发式评估(Nielsen,1994)由专业评估人员根据公认的可用性原则(启发式)检查界面,这些原则包括系统状态的可见性、系统与现实世界的匹配度、用户控制、一致性、错误预防、识别而非回忆、使用的灵活性和效率、美学设计和帮助等。
- 服务质量评估 :实际系统还应根据其提供的服务质量进行评估。评估不仅要考虑用户对系统性能的感知,还要考虑用户对系统的期望和需求。量化系统对用户的价值并非易事,但对于语音交互系统来说,质量因素涉及对支持自然交互的通信原则的识别以及对系统可靠提供真实信息能力的信任。
- 标准化与评估 :系统评估还与通用标准化过程相关,通过该过程可以定义界面设计和制造的行业最佳实践标准。一旦特定的交互功能得到标准化,它们就会影响用户对有用系统的期望。
- Loebner 奖
超级会员免费看
订阅专栏 解锁全文
46

被折叠的 条评论
为什么被折叠?



