23、深度学习语音识别中的鲁棒特征研究

深度学习语音识别中的鲁棒特征研究

1. 鲁棒特征提取方法

1.1 NMC 特征提取

NMC(Normalized Modulation Cepstral)特征提取从语音窄带信号开始,其核心在于估计的 AM 信号对噪声具有鲁棒性。具体步骤如下:
1. 预加重 :使用预加重滤波器对语音信号进行处理。
2. 加窗分析 :采用 26ms 的 Hamming 窗,以 10ms 的帧速率对信号进行分析。
3. 滤波处理 :将加窗后的语音信号 sw[n] 通过一个 40 通道的 gammatone 滤波器组,频率范围为 200 - 7500Hz(针对 16kHz 信号)。
4. AM 信号获取 :使用修改后的 DESA 算法,为每个通道获取 AM 时间信号 ak;j[n]。
5. 归一化与去偏 :对 AM 功率进行归一化,然后使用类似方法进行去偏处理。
6. 功率压缩 :对去偏后的 AM 功率谱进行 15 次根功率压缩,得到的结果即为 NMC 特征集。

1.2 MMeDuSA 特征提取

MMeDuSA(Modulation of Medium Duration Speech Amplitudes)特征提取基于简化的瞬时 AM 信号估计方法,具体步骤如下:
1. 预加重与加窗 :对语音信号进行预加重,然后使用 51ms 的 Hamming 窗,以 10m

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值