语音识别与情感分析:模型性能与可解释性探索
语音识别中的词汇扩展
在语音识别领域,尤其是子词加权有限状态转换器(WFST)自动语音识别(ASR)系统中,词汇扩展是一个重要的研究方向。通过创建一个增强有限状态转换器(FST),并将其与解码图组合,可以增加新添加词汇的识别概率。
不同增强权重值的影响
| a | 含OOV词的结果(精度%、召回率%、F1%、未识别率%、词错误率%、字符错误率%) | 含所有词的结果(精度%、召回率%、F1%、未识别率%、词错误率%、字符错误率%) |
|---|---|---|
| 0.5 | 97.5、76.1、85.5、33、11.3、4.1 | 97.5、76.1、85.5、33、11.3、4.1 |
| 1.0 | 97.5、75.5、85.2、31、11.2、4.0 | 97.5、75.5、85.2、31、11.2、4.0 |
| 1.5 | 96.4、76.6、85.3、31、11.3、4.0 | 96.4、76.6、85.3、31、11.3、4.0 |
| 2.0 | 94.8、78.0、85.6、30、11.3、4.1 | 94.8、78. |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



