非负矩阵与张量分解在音频源分离中的应用
在音频处理领域,源分离是一项关键任务,旨在从混合信号中提取出各个独立的源信号。非负矩阵分解(NMF)及其扩展方法,以及非负张量分解(NTF),为解决这一问题提供了有效的途径。
1. 非负矩阵分解(NMF)及其扩展方法
NMF是一种广泛应用于音频源分离的技术。通过将非负矩阵分解为两个或多个非负矩阵的乘积,可以实现对音频信号的特征提取和分离。以下是几种NMF的扩展方法及其性能对比。
1.1 不同NMF方法的性能对比
为了评估不同NMF方法在语音分离中的性能,进行了相关实验。实验使用了男女说话者的语音数据,创建了90个测试混合信号,并进行了15折交叉验证。评估指标包括源失真比(SDR)、信号干扰比(SIR)和源伪像比(SAR)。具体结果如下表所示:
| 方法 | 基的数量 | 女性SDR | 女性SIR | 女性SAR | 男性SDR | 男性SIR | 男性SAR |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| NMF | K = 10 | 6.76 | 10.34 | 9.94 | 6.28 | 8.92 | 10.51 |
| NMF | K = 20 | 6.83 | 10.05 | 10.27 | 6.34 | 8.82 | 10.81 |
| LNMF | K1 = 180, K2 = 10 | 7.26 | 11.09 | 10.14 | 6.75 | 9.46 | 10.78 |
| LNMF | K1 = 180, K2 = 20 | 7.38 | 10.94 | 10.
超级会员免费看
订阅专栏 解锁全文
1463

被折叠的 条评论
为什么被折叠?



