语音识别:从数字识别到智能问答的技术演进
在语音识别技术的发展历程中,数据和评估体系起着至关重要的作用。早期,TI - DIGITS数据库推动了语音识别技术的初步发展,随后DARPA的一系列项目和评估活动,更是加速了该领域的进步,从资源管理项目到航空旅行信息系统项目,语音识别技术不断面临新的挑战和突破。
早期语音识别与TI - DIGITS数据库
早期的语音识别技术在数字识别方面取得了显著进展。AT & T开发的基于数字分段特征的系统,实现了低至0.2%的数字错误率。DARPA社区投入大量精力创建了一系列标准化数据库,如TIMIT、RM(资源管理)、ATIS(航空旅行信息系统)、WSJ(《华尔街日报》)等,自动语音识别(ASR)社区也将这些数据库用于常规评估和测试。
TI - DIGITS数据库被广泛应用,大多数研究团队用它来展示其识别技术的有效性和扩展性,即从识别小词汇量的数字到识别大词汇量的自然语音。即便在今天,几乎每个可用的语音识别系统都会对TI - DIGITS数据库进行测试,以确保系统基本正常运行。然而,该数据库是在声学控制良好的“干净”环境中录制的,不能代表现实生活中存在背景噪音和其他干扰的典型工作场景。不过,语音识别界过了几年才开始关注在非理想声学环境下的自然语音识别。
DARPA评估时代与资源管理项目
TI - DIGITS的成功促使DARPA在20世纪70年代语音理解研究项目(SUR)失败后,重新审视语音识别研究。1983年,DARPA启动了一项耗资10亿美元、为期10年的项目,旨在推动与机器智能相关的所有技术领域的创新和研究,并将取得的技术成果应用于国防工业,语音识别自然成为目标领域之一。
语音识别技术演进史
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



