28、语音识别系统的发展与应用解析

语音识别系统的发展与应用解析

语音识别系统的挑战与误差控制

从传统的按键式系统向基于语音识别的系统转变时,会面临诸多挑战。传统按键系统只需考虑用户按下提示之外的 12 个按键的可能性,但语音识别系统则要应对用户说出的无限种不符合识别语法的内容,识别器需将其识别为“不匹配”。例如,当用户说“我讨厌电脑”时,系统不应误将其识别为“位置和时间”或“账户信息”,而应拒绝该输入,先向用户道歉并重新提示。

语音识别还存在误差问题。即使研究人员多年努力,也难以使识别准确率达到 100%。即便在最佳条件下,使用最简单的词汇,如“是”和“否”,识别器仍可能出错。例如,在识别准确率为 99.9%的情况下,每一千次中仍可能有一次将“否”误识别为“是”,这在某些情况下可能导致严重后果。

为应对这些误差,语音用户界面(VUI)设计师采用了误差控制策略。语音识别器不仅会解读用户话语,还会为解读结果赋予一个“置信度”数值。置信度可作为判断是否信任识别结果的重要标准。例如,询问用户出发城市时,识别器将用户话语解读为“波士顿”,并赋予 857(1 - 1000 分,1000 为确定)的置信度,置信度越高,解读越可能正确,系统可能会信任该结果并继续流程;若置信度低于 300,系统可能会拒绝该结果并重新提示用户。

通常,置信度低时系统会要求确认,极低时会重新提示,高时则会认为识别结果正确并进入下一步。以下是一个航班信息系统为一位不太幸运的用户进行误差控制的对话示例:
| 交互环节 | 内容 |
| ---- | ---- |
| 系统询问 | 请告诉我出发城市。 |
| 用户回答 | 波士顿 |
| 识别结果 | “奥斯汀”,低置信度 |

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值