谱减法（）

阿凡凡提

已于 2023-04-02 22:51:11 修改

阅读量385

点赞数 1

文章标签：语音识别人工智能

于 2022-11-16 21:04:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/afanti_1/article/details/127893289

版权

谱减法根据无声段统计噪声得到的方差，作为当前帧的噪声估计谱，当某帧的噪声分量较大时，则谱减后会有噪声残留，增强后的语音在频谱上有随机尖峰出现，即夹杂着有节奏的音乐噪声（传统谱减法的主要缺点）。并且由于算法的特殊性，谱减法只能对有限长语音信号进行去噪，即需要对音频进行截取处理，这导致其不适用于对语音进行实时去噪。

噪声不知道所以对噪声进行估计！

一般情况下，噪声为加性噪声，处于开始那端！

时间上一帧一帧的相减！！

语音信号具有短时不变性，时间短的时候具有周期性。所以用STFT

每一个点表示一个频率成分！！频率点相减

20-40帧取均值

不管哪个t，噪声都是一样的！！

Mag 幅度

效果原因有两个：一是噪声取得均值啥的不好，，因为前30秒都没搞干净。

频率内如果是上图那样（有增有减门函数），在时域会变成sin函数，时域有截断效应，往回变是把信号截短。截短后再进行傅里叶变换，然而截短会导致频谱泄露。iSTFT之后做STFT，可能会导致震荡衰减。边角还会产生尖峰。

所以说硬减效果并不好，因为估计的噪声本就不准确，会产生音乐噪声的现象。

直接谱减并不好用！！

不连续，想办法平滑一下。

使用的是相邻帧的最小值！！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。