先进自动语音识别技术:提升复杂环境下的性能
在当今科技发展中,自动语音识别(ASR)技术在各种复杂环境下的应用需求日益增长。本文将介绍一系列先进的ASR技术,包括POI名称搜索、去混响方法以及判别式训练方法,这些技术有助于提升ASR在嘈杂和混响环境中的鲁棒性。
1. POI名称搜索系统
在商业汽车导航系统中,POI(兴趣点)名称搜索是一项重要功能。传统的基于单词的匹配过程在处理错误识别时可能效果不佳,而基于音节的N - gram匹配则能提供更好的解决方案。
- N - gram匹配优势 :以“Bijutsukan”(美术馆)被错误识别为“Bujutsukan”(武术馆)为例,基于单词的匹配可能无结果或无得分,而基于音节的匹配能找到三个匹配的音节N - gram,即“ju - tsu”、“tsu - ka”和“ka - n”,这些匹配项包含在“Bijutsukan”等POI名称中,可通过预定的倒排索引快速计算得分。
- 系统操作流程
- 用户触摸“语音输入”按钮并说出“Sky Building”,搜索系统启动。
- 自动语音识别(ASR)结果“Sky Building”显示,同时提供语音输出。
- 从POI中检索出48个名称包含“Sky Building”的设施,并在屏幕上列出部分,如“Kiji Sky Building”、“Sky Building Parking Lot”等。
- 用户可手动选择所需POI,也可通过说出“Next”或“Previous”进行选择,还能说出额外的
超级会员免费看
订阅专栏 解锁全文
1796

被折叠的 条评论
为什么被折叠?



