语音信号处理基础（三）

最新推荐文章于 2024-10-11 15:28:55 发布

原创

最新推荐文章于 2024-10-11 15:28:55 发布 · 1.5k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

倒谱分析是语音信号处理中的关键技术，用于提取频谱的包络，即共振峰，以识别不同声音。通过对语音频谱取对数、做傅里叶逆变换，可以得到频谱的低频部分，即倒谱，它描述了频谱的包络，在语音识别中具有重要应用。

语音信号处理基础（三）

倒谱分析（Cepstrum Analysis）

下面是一个语音的频谱图。峰值表示语音的主要频率成分，我们把这些峰值称为共振峰（formants），共振峰携带了声音的辨识属性（就像个人身份证一样），特别重要，用它就可以识别不同的声音。
这里写图片描述
我们要提取的不仅仅是共振峰的位置，还得提取它们转变的过程。所以我们提取的是频谱的包络（Spectral Envelope）。这包络就是一条连接这些共振峰点的平滑曲线。

将原始的频谱由两部分组成：包络和频谱的细节。这里用到的是对数频谱，所以单位是dB（分贝）。我们需要把这两部分分离，就可以得到包络了。
这里写图片描述
在给定log X[k]的基础上，求得log H[k] 和 log E[k]以满足log X[k] = log H[k] + log E[k]。为了达到这个目标，我们需要对频谱做FFT。在频谱上做傅里叶变换就相当于逆傅里叶变换Inverse FFT (IFFT)。需要注意的一点是，我们是在频谱的对数域上面处理的。在对数频谱上面做IFFT就相当于在一个伪频率（pseudo-frequency）坐标轴上描述信号。
这里写图片描述
由上图可

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。