9、提升语音识别性能:方言特定语言模型与情感语音识别研究

提升语音识别性能:方言特定语言模型与情感语音识别研究

方言特定语言模型提升印度低资源语言语音识别性能

在语音识别领域,对于低资源印度语言如孟加拉语和博杰普尔语,方言特定语言模型展现出了显著优势。

技术实现

研究采用了n-gram增强的束搜索解码技术。借助pyctcdecode库进行束搜索算法,并利用语言模型中的语言信息,系统能够探索一系列可能的单词序列,从而在语音识别任务中实现更准确、上下文连贯的转录。具体操作步骤如下:
1. 语言模型创建 :使用KenLM创建语言模型,该模型基于提供的语音转录和挑战数据集中的额外文本语料进行训练。
2. 实验设置 :将束宽度设置为100,并测试了3、4、5和6等不同的n-gram配置。同时,利用可用的方言ID将文本语料数据分类为特定方言的文本。

实验结果

通过单词错误率(WER)指标对不同系统进行比较,结果如下表所示:
| 模型 | 孟加拉语WER | 博杰普尔语WER |
| — | — | — |
| AM | 21.8 | 21.21 |
| AM + 3 gram LM - All | 16.42 | 17.10 |
| AM + 3 gram LM - Dialect | 15.90 | 16.95 |
| AM + 4 gram LM - All | 16.12 | 16.87 |
| AM + 4 gram LM - Dialect | 15.77 | 16.43 |
| AM + 5 gram LM - Al

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值