要让电脑识别语音信号,必须经过一系列的处理。
一.录制一段音频,wav格式
二.用倒谱系数法提取特征值。
MFCC,Mel频率倒谱系数的缩写。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。
我这里用的是一个语音工具箱voicebox,里面有一个函数melcepst.m可以方便的求MFCC。
关于提取的详细过程:
预滤波:CODEC前端带宽为300-3400Hz的抗混叠滤波器。

本文介绍了在语音识别中使用MATLAB进行MFCC预处理的步骤,包括预滤波、加窗、快速傅立叶变换、离散余弦变换等,并通过voicebox工具箱的melcepst函数提取特征,最后保存为.mat文件用于后续的语音识别学习与识别。
最低0.47元/天 解锁文章
1238

被折叠的 条评论
为什么被折叠?



