Mel频率倒谱系数(MFCC)

本文介绍了Mel频率倒谱系数(MFCC)的概念及其在语音识别中的应用。MFCC是一种基于人耳听觉特性的特征提取方法,能有效描述语音信号的能量、基音频率等特征。文章还解释了Mel频率的概念及其实现原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient)的缩写是MFCC,Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。

 

作用:和线性预测倒谱系数LPCC一起用于描述语音特征的参数:能量,基音频率,共振峰值等。

 

1.Mel频率:

是模拟人耳对不同频率语音的感知。

人类对不同频率语音有不同的感知能力:对1kHz以下,与频率成线性关系,对1kHz以上,与频率成对数关系。频率越高,感知能力就越差了。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。

在Mel频域内,人对音调的感知能力为线性关系,如果两段语音的Mel频率差两倍,则人在感知上也差两倍。 

转换公式:B(f)=1125ln(1+f/700) ,其中f为频率,B为Mel-频率。

 

2.倒谱:

同态处理的结果,分为复数和实数倒谱,常用实数倒谱,是语音识别中的重要系数。

 

转载于:https://www.cnblogs.com/lisa990/p/7282450.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值