语音与噪声联合估计及机器异常声音检测的数据增强新方法
在语音处理和机器异常声音检测领域,有两项重要的研究成果值得关注。一项是关于语音与噪声的联合估计,通过新的策略提升语音识别效果;另一项是利用有限元分析进行机器异常声音检测的数据增强,以解决现有数据不足的问题。
语音与噪声联合估计
在语音处理中,传统的针对信噪比(SNR)目标优化的模型大多局限于语音估计。而实际上,噪声估计在语音预测模型中也起着重要的互补作用。
联合估计网络结构
研究提出了一种联合语音 - 噪声预测网络,其结构包含两个分支:语音估计网络和噪声估计网络。这两个分支分别使用基于L1损失的SNR自适应目标学习策略进行训练。
- 训练目标公式 :训练目标 $Y (d, l)$ 由公式 $Y (d, l) = S(d, l) + k_{opt} N(d, l)$ 表示,其中 $k_{opt}$ 是优化后的标量,用于调整SNR目标。训练过程采用L1损失,即 $L = |Y (d, l) - \hat{Y} (d, l)|_1$。
- 噪声估计网络目标 :对于噪声估计网络,给定 “SNR改善” 时,目标公式为 $Y_n(d, l) = k_n S(d, l) + N(d, l)$,其中 $k_n$ 用于控制噪声估计网络的语音残差。当 $k_n$ 设为 0 时,网络变为纯噪声估计网络。最后的输出 $\hat{Y} (d, l) = (1 - \lambda) \hat{Y}_s(d, l) + \lambda (X(d, l) - \hat{Y}_n(d, l))
超级会员免费看
订阅专栏 解锁全文
779

被折叠的 条评论
为什么被折叠?



