梅尔频率倒谱系数（MFCC）理论整理

最新推荐文章于 2024-10-09 20:49:43 发布

Rookie羊

最新推荐文章于 2024-10-09 20:49:43 发布

阅读量726

点赞数

分类专栏：语音文章标签： MFCC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_28662689/article/details/90175786

版权

语音专栏收录该内容

5 篇文章

订阅专栏

主要图形：时域图、频谱图、语谱图
https://blog.youkuaiyun.com/yongchunaq/article/details/36227961

基础参考博客：https://blog.youkuaiyun.com/zouxy09/article/details/9156785
https://blog.youkuaiyun.com/qq_28006327/article/details/59129110

主要知识要点：STFT（短时傅里叶变换）、梅尔频谱（Mel Bank Features）与梅尔倒谱（MFCCs）
傅里叶变换数学理论的扩展阅读：https://www.zhihu.com/question/21040374

提取MFCC特征的过程：
（1）（2）为了将时域图变为频谱图

1）先对语音进行预加重、分帧和加窗；
语音的预加重：去除口唇辐射的影响，增加语音的高频分辨率
元音能量主要集中在1KHz以下，并且以6dB/十倍频的速度下降，可以使用欲加重技术增强高频能量，这在回声消除以及语音识别中的特征提取（共振峰， LPC）中用到，声道的终端是口和唇，口唇辐射对低频影响比较小，但是对高频段影响比较大，欲加重技术技术为了提升高频分辨率

分帧和加窗的理解：https://www.zhihu.com/question/52093104

2）对每一个短时分析窗，通过FFT得到对应的频谱；

3）将上面的频谱通过Mel滤波器组得到Mel频谱；

4）在Mel频谱上面进行倒谱分析（取对数，做逆变换，实际逆变换一般是通过DCT离散余弦变换来实现，取DCT后的第2个到第13个系数作为MFCC系数），获得Mel频率倒谱系数MFCC，这个MFCC就是这帧语音的特征；

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。