- 博客(11)
- 收藏
- 关注
原创 梅尔频率倒谱系数(MFCC)
梅尔倒谱系数(MFCC):是在Mel标度频率域提取出来的倒谱参数,Mel标度描述了人耳频率的非线性特征,它与频率的关系可用下式表示:语音特征参数MFCC提取过程:1、 预加重:将语音信号通过一个高通滤波器:式中u的值介于0.9-1.0之间,通常取0.97。预加重的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱。2、 分帧先将N个采样点集合成一个观测单位,称为帧。通常情况下N的值为256或512,涵盖的时间约为20~30ms左右。为了避免相邻两帧的
2022-01-21 10:25:33
4897
原创 语音识别特征参数提取
方法一:线性预测分析(LPC)假设系统的传递函数与全极点的数字滤波器是相似的,通常12-16个极点就可以描述语音信号的特征。所以对于n时刻的语音信号,可以用之前时刻的信号的线性组合近似的模拟,然后计算语音信号的采样值和线性预测的采样值,并让这两者之间达到均方的误差(MSE)最小,就可以得到LPC。方法二:感知线性预测系数(PLP)一种基于听觉模型的特征参数,该参数等效于LPC特征,也是全极点模型预测多项式的一组系数。不同之处是PLP基于人耳听觉,通过计算应用到频谱分析中,将输入语音信号经过人耳听觉模型
2022-01-21 09:06:27
1118
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人