6、联合时域和频域渐进学习用于语音增强与识别

联合时域和频域渐进学习用于语音增强与识别

1. 融合模块

融合模块连接渐进频域掩蔽模块和渐进混合域模块。具体操作流程如下:
1. 融合模块接收渐进频域掩蔽模块估计的掩蔽 $M_{FPL}^i$ 以及带噪语音 $y$ 的频谱和相位,通过逆短时傅里叶变换(ISTFT)得到重构语音 $\hat{y} {FPL}^i$。
2. 将 $\hat{y}
{FPL}^i$ 输入到渐进混合域模块,融合时域和频域的信息,得到预测波形 $\hat{y} {MPL}^i$。
3. 提出一种新的融合策略,结合渐进频域掩蔽模块和渐进混合域模块的输出,以进一步利用不同域信息的互补性:
- $LPS
{fusion}^i = \lambda * FLPS(\hat{y} {MPL}^i) + (1 - \lambda) * FLPS(\hat{y} {FPL}^i)$
- $\hat{y} {fusion}^i = FReconst {LPS}(\hat{y} {MPL}^i, LPS {fusion}^i, W_{istft})$
其中,通过加权融合方法获得融合的对数功率谱(LPS)特征 $LPS_{fusion}^i$,权重参数 $\lambda$ 范围是 0 到 1。函数 $FReconst_{LPS}(·)$ 表示基于 LPS 特征和 $\hat{y} {MPL}^i$ 的相位进行波形重构,$\hat{y} {fusion}^i$ 表示通过融合策略得到的波形。

2. 多目标损失

采用多任务学习方法来训练 TF

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值