人工智能与蛮力算法在语音识别中的较量
在语音识别技术发展的历程中,人工智能和蛮力算法(如模板匹配和动态时间规整)曾展开过激烈的竞争,各自展现出不同的特点和成效。
早期语音识别的困境与分歧
早期,科学家们试图收集足够的知识并将其编码成计算机可读的形式,以实现语音识别。然而,即便有顶尖的语言学家、语音学家和计算机科学家多年的努力,大多数基于人工智能的语音识别系统成效不佳,其进展也难以衡量。与之相对,模板匹配和动态时间规整这种蛮力工程方法虽在特定任务(如识别特定说话者说出的少量单词)上取得了一些可衡量且有趣的成果,但普遍观点认为这种方法无法推动科学进步,也难以实现类人语音识别。
AT & T的执行董事皮尔斯(Pierce)禁止公司进一步投资语音识别,并建议美国政府停止对该领域学术研究的资助。不过,贝尔实验室的吉姆·弗拉纳根(Jim Flanagan)有不同看法。1971年左右,他以对说话者识别的兴趣为切入点,邀请了来自日本电报电话公司(NTT)的板仓文忠(Fumitada Itakura)来访。板仓文忠在几个月内就展示了一个基于动态时间规整(DTW)的航班信息语音识别系统,在贝尔实验室未开展相关研究的两年里,他的工作为语音识别带来了进展。
ARPA语音理解项目
尽管皮尔斯提出反对意见,20世纪70年代初,美国政府资助了首个大规模语音理解项目——ARPA语音理解研究(SUR)项目。该项目旨在推动人工智能在解决通用语音理解问题上的发展,其目标是理解语音中的思想和概念,而非仅仅识别单词序列。
最初,该项目对系统设定了较为严格的要求,要求识别任何用户在任何声学环境下使用10000个词汇的任何话语。后来,在顾问的帮助下,要求
人工智能与语音识别较量
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



