语音识别与情感分析:模型性能与可解释性探索
语音识别中的词汇扩展
在语音识别领域,尤其是子词加权有限状态转换器(WFST)自动语音识别(ASR)系统中,词汇扩展是一个重要的研究方向。通过创建一个增强有限状态转换器(FST),并将其与解码图组合,可以增加新添加词汇的识别概率。
不同增强权重值的影响
a | 含OOV词的结果(精度%、召回率%、F1%、未识别率%、词错误率%、字符错误率%) | 含所有词的结果(精度%、召回率%、F1%、未识别率%、词错误率%、字符错误率%) |
---|---|---|
0.5 | 97.5、76.1、85.5、33、11.3、4.1 | 97.5、76.1、85.5、33、11.3、4.1 |
1.0 | 97.5、75.5、85.2、31、11.2、4.0 | 97.5、75.5、85.2、31、11.2、4.0 |
1.5 | 96.4、76.6、85.3、31、11.3、4.0 | 96.4、76.6、85.3、31、11.3、4.0 |
2.0 | 94.8、78.0、85.6、30、11.3、4.1 | 94.8、78. |