31、先进循环神经网络与序列判别训练在自动语音识别中的应用

先进RNN与序列判别在ASR中的应用

先进循环神经网络与序列判别训练在自动语音识别中的应用

1. 先进循环神经网络评估

在自动语音识别(ASR)领域,先进的循环神经网络(RNN)模型正发挥着重要作用。为了评估不同模型的性能,采用了词错误率(WER)这一指标。实验主要在AMI会议语料库上进行,若未特别说明,使用的是SDM评估集。由于在模型训练时未排除重叠语音段,因此除了给出完整评估集的结果外,还给出了仅包含非重叠语音段子集的结果。

1.1 PAC - RNN

PAC - RNN在两个不同任务上进行了评估:使用IARPA - Babel语料库的低资源语言大词汇量连续语音识别(LVCSR)任务,以及使用AMI语料库的远场语音识别任务。
- 低资源语言任务 :不同模型在低资源语言设置下的WER结果如下表所示:
|目标语言|宿务语|库尔德语|斯瓦希里语|
| ---- | ---- | ---- | ---- |
|最接近语言|他加禄语|土耳其语|祖鲁语|
|SBN模型 - 单语|73.5|86.2|65.8|
|SBN模型 - 适应多语言|65.0|75.5|54.9|
|SBN模型 - 最接近语言|63.7|75.0|54.2|
|混合模型 - DNN|63.9|74.9|54.0|
|混合模型 - LSTM|63.0|74.0|53.0|
|混合模型 - PAC - RNN - DNN|62.1|72.9|52.1|
|混合模型 - PAC - RNN - LSTM|60.6|72.5|51.4|
|混合模型 - 最接近语言初始化 - DNN|62.7|73.1|52.4|

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值