语音交互类型与语音用户界面设计全解析
在当今科技飞速发展的时代,语音交互技术逐渐成为了人机交互领域的热门话题。开发者们借助语音识别和文本转语音(TTS)技术,能够为应用程序打造出各式各样的语音交互功能。下面我们就来深入了解一下语音交互类型以及语音用户界面(VUI)的设计要点。
语音交互类型
利用语音识别和 TTS 技术,开发者可在应用中构建多种语音交互类型,主要有以下四种:
| 交互类型 | TTS | 语音识别 | 无状态 | 描述 | 示例任务及命令词 |
| — | — | — | — | — | — |
| 朗读器(Reader) | 是 | 否 | 是 | 朗读文本 | 电子邮件阅读器、GPS 导航仪 |
| 倾听器(Listener) | 否 | 是 | 是 | 将用户所说内容转录为文本 | 电子邮件撰写器 |
| 命令(Command) | 可能 | 是 | 是 | 用户通过语音单次下达命令给应用,若命令失败需重试,应用可能回复文本但不追问后续问题 | 食谱阅读器:“下一步”;电子邮件阅读器:“读第一封” |
| 多轮命令(Multi - turn Command) | 是 | 是 | 否 | 用户下达语音命令,应用可能要求更多信息,对话可能有多轮,应用需维护状态 | 待办事项列表管理:“用户:添加面包”“应用:添加到哪个列表?”“用户:购物清单” |
这四种语音交互类型在自然度、功能强大性与准确性之间存在权衡关系:
- 朗读器(Reader) :始终准确,因为用户使用传统输入方式。
- 倾听器(Listener)
超级会员免费看
订阅专栏 解锁全文
1310

被折叠的 条评论
为什么被折叠?



