9、语音识别技术的发展历程与挑战

语音识别技术的发展历程与挑战

早期语音识别尝试:AUDREY的局限

早期的语音识别设备AUDREY在当时是一项令人瞩目的成就,它能够清晰缓慢地识别语音。然而,它只是一个实验性的设备。AUDREY体积庞大,占据了一个六英尺高的继电器架,成本高昂,耗电量大,并且由于采用复杂的真空管电路,存在众多维护问题。

其可靠运行仅限于准确识别指定说话者说出的数字。它可用于语音拨号,供长途话务员或富裕的电话用户使用,但与手动拨号相比,竞争力较弱。在大多数情况下,按键拨号识别数字比语音说出连续数字更快、更便宜。

AUDREY作为首个在科学期刊上报道的自动语音识别器,凸显了语音识别面临的诸多挑战:
1. 说话停顿要求 :AUDREY只有在说话者在单词之间停顿的情况下才能正常工作。但在正常语音中,单词之间没有明显的间隔,说话时停顿是不自然的。此外,协同发音现象使得连续的语音有时会合并成一个声音,增加了识别的难度。AUDREY只能进行“孤立词”或“孤立语音识别”,无法分离正常语音中的单词,直到几十年后才有可能实现“连续语音识别”。
2. 说话者依赖性 :AUDREY需要针对每个说话者进行调整。不同说话者的声音具有不同的声学特性,共振峰频率和F1/F2平面上的模式会有所不同,因此需要对每个说话者进行微调以保持合理的识别准确率。如果不进行调整,在随机数字系列中,准确率可能会降至50%或60%。
3. 词汇局限性 :AUDREY只能识别数字,并且仅适用于美国英语。识别其他类型的单词,如人名、地名或简单命令,需要对其电路进行重大修改,而且即使修改也可能无法实现。例如,对于

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值