- 博客(4)
- 资源 (2)
- 收藏
- 关注
原创 Audio-Visual Speech Enhancement Based on Multimodal Deep Convolutional Neural Networks
为了获得令人满意的性能,语音增强(SE)已被用作各种语音相关应用的基础单元,例如自动语音识别 [1, 2]、说话人识别 [3, 4]、语音编码 [5, 6]、助听器 [7, 8] 和人工耳蜗 [9, 10]。在过去的几十年中,已提出了许多语音增强方法,并被证明可以提高音质。一种显著的方法是谱恢复,它基于噪声和语音成分的统计信息估计增益函数,随后在频域中使用该函数抑制噪声成分,以从带噪语音谱中获得干净的语音谱 [11–15]。另一类方法采用非线性模型将带噪语音信号映射到干净语音信号 [16–19]。
2024-12-17 18:11:54
715
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1