深度学习在源分离中的应用与展望
1. 不同模型在不同信噪比下的 STOI 对比
源分离在语音和音频处理领域至关重要,为了评估不同模型在不同信噪比(SNR)下的性能,这里给出了使用 DNN、LSTM 以及不同变体的 NTM 和 RCNN 时的短期客观可懂度(STOI)对比。
| 模型 | -5 dB | 0 dB | 5 dB |
| — | — | — | — |
| 未处理 | 0.647 | 0.746 | 0.829 |
| DNN | 0.678 | 0.785 | 0.844 |
| LSTM | 0.718 | 0.815 | 0.872 |
| NTM | 0.731 | 0.825 | 0.877 |
| RCNN w/o cd t & Lenc | 0.738 | 0.833 | 0.883 |
| RCNN w/o Lenc | 0.742 | 0.835 | 0.887 |
| RCNN w/o cd t | 0.747 | 0.838 | 0.886 |
| RCNN | 0.744 | 0.837 | 0.888 |
从表格中可以看出,随着信噪比的提高,各模型的 STOI 值都有所增加。并且,RCNN 及其变体在不同信噪比下大多表现出较好的性能。
2. 深度学习方法在源分离中的应用
深度学习方法在源分离领域得到了广泛应用,涵盖了从深度神经网络到循环神经网络等多种类型。以下是一些关键的应用点:
- 信号处理方法的融合 :将 Tucker 分解和频谱掩蔽等信号处理方法融入深度学习中
超级会员免费看
订阅专栏 解锁全文
1303

被折叠的 条评论
为什么被折叠?



