先进自动语音识别技术:从导航到电梯,提升复杂环境下的识别能力
在当今科技发展的浪潮中,自动语音识别(ASR)技术在各种复杂环境下的应用需求日益增长。本文将深入探讨一些先进的ASR技术,包括POI名称搜索在汽车导航系统中的应用、免提电梯的去混响方法以及声学模型和语言模型的判别式训练方法。
1. POI名称搜索在汽车导航系统中的应用
在商业汽车导航系统中,POI(兴趣点)名称搜索功能极大地提升了用户的使用体验。传统的通过假名键盘逐字手动输入的方式效率低下,而新的搜索系统则采用了更高效的方法。
- N - gram匹配 :在名称匹配过程中,基于音节的N - gram匹配比基于单词的匹配更具优势。例如,当“Bijutsukan”(美术馆)被错误识别为“Bujutsukan”(武术馆)时,基于单词的匹配可能无法得出结果或得分,但基于音节的匹配可以找到三个匹配的音节N - gram,即“ju - tsu”、“tsu - ka”和“ka - n”,这些匹配项会对得分产生贡献,并且可以通过预先确定的倒排索引快速计算得分。
- 系统操作流程 :用户只需触摸“语音输入”按钮并说出POI名称,如“Sky Building”,搜索系统就会被激活。自动语音识别(ASR)的结果“Sky Building”会显示在屏幕上,同时还会提供语音输出。系统会从POI数据库中检索出名称包含“Sky Building”的48个设施,并将其中一些列在屏幕上,如“Kiji Sky Building”、“Sky Building Parking Lot”等。此时,用户可以手动选择所需的POI,也可以通过说出“Next”或“
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



