29、语音识别中的数据增强、选择与先进循环神经网络技术

语音识别中的数据增强、选择与先进循环神经网络技术

训练数据增强与选择

在语音识别领域,训练数据的质量和数量对模型的性能有着至关重要的影响。为了提高语音识别器在不匹配的训练 - 测试条件下的鲁棒性,数据增强是一种有效的技术。

神经网络的配置

为了找到总结神经网络的最佳配置,进行了一系列实验,主要从以下几个方面进行了调整:
1. 连接层 :评估了将总结向量添加到不同隐藏层(连接层)的效果。在实验中,DMM 和 SNN 所有隐藏层的大小均为 2048,且有噪声的训练数据量与原始干净数据集相同。CHiME - 3 的实验结果如下表所示:
| 连接层 | XE (%WER) |
| ---- | ---- |
| 无 | 47.72 |
| 1 | 39.89 |
| 2 | 39.32 |
| 3 | 40.09 |
| 4 | 41.08 |
| 5 | 40.70 |

从表中可以看出,将总结向量添加到第二个隐藏层对于使干净的 DNN 适应有噪声的数据最为有效。并且,通过向干净的 DNN 添加总结向量提取器,绝对字错误率(WER)降低了超过 8%。
2. 总结向量的大小 :以第二个隐藏层作为连接层,评估了总结向量的最佳大小。为了训练不同大小的总结向量提取器,需要在干净数据上重新训练具有不同第二个隐藏层大小的原始 DNN 分类器。CHiME - 3 的 WER 降低情况如下表所示:
| 第二层大小 | 256 | 512 | 1024 | 2048 |
| ---- |

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值