语音增强理论与实践要点

维纳滤波

维纳滤波一开始设计的一个系统就是线性时不变滤波器,希望输入信号经过该系统,输出能够无限逼近期望信号。它是平稳随机i信号线性最小均方滤波。维纳滤波器被认为是(均方误差)复频谱最优估计器,但并不是频谱幅度最优估计。
维纳解一般有三种求法:1 直接求逆;2 Levison-Durbin算法;3最陡下降法。
以上三种有两个前提:1 Rxx和rdx必须已知;2输入信号x(n)和d(n)必须是宽平稳的,否则二阶统计特征是时变的,每个时刻必须重新估计,实际中几乎很难实现。从而有了后面自适应滤波的方法。
维纳滤波器有时域和频域形式,有FIR和IIR公式,还有非因果维纳滤波器(需要block data,从而可利用非因果系统)

自适应滤波器

LMS
利用瞬时误差能量代替集总平均能量来计算估计的梯度,影响到收敛最优解的性能,包括收敛速度、收敛稳定性和收敛最优解附近的摆动。
步长的要求:0<u<2/MPx,M是滤波器阶数,Px是输入信号功率
由于只利用了输入信号x(n)和期望信号d(n),所以允许非平稳假设。非平稳情况下,收敛后稳态性能讨论意义不大。固平稳条件下,先用大步长保证快速收敛,然后小步长保证均方差超量小(稳态性能)
收敛稳定性:必要条件为,1-uλ 取绝对值,小于1。
收敛速度:收到输入信号的自相关矩阵Rxx最大特征值和最小特征值分散程度,如果接近,则收敛快,如果分散则收敛速度慢。
均方误差的超量:和步长成正比,因此实际工作中,步长需要取折中;和滤波器阶数成正比,因此M也需要取折中。

NLMS:
根据步长的限制,收到信号功率的影响,保证步长满足收敛稳定前提下,做除以信号功率的处理,这样步长独立于信号功率,加速了收敛速度,但是不能改善收敛后的均方差超量(稳态性能)。
为了防止在小输入信号功率时产生了较大的步长,有引入正则项(非常小的常数)。
u(n)=a/(MPx + c),a从0-2,M是滤波器阶数,Px是估计的信号功率(时变的),c是正则项。

RLS:
引入更多的调控参数,客服LMS缺点(特征值分散时收敛速度很慢;收敛后存在稳态误差的超量),如果输入信号Rxx有M的不同的特征值,则可以引入M个调控参数。

基于统计模型的方法

不同于维纳滤波器(对信号复频谱建模),这是基于信号幅度谱各种统计模型和优化准则的非线性估计,这些估计器通常和基于语音存在概率的增益修正软判决方法组合使用。
webrtc里ns利用了MMSE结合语音存在概率方法,估计量采用的是基于多特征模型的计模型的方法(先验信噪比MMSE估计和多特征建模),非线性估计。
aec的非线性处理部分跟ns类似。

参考文章:
语音增强理论与实践
数字信号处理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值