基于Matlab GUI的DWT+MFCC数字语音识别
数字语音识别是指将语音信号转换为可识别的文字信息。数字语音识别技术在今天的社会中得到了广泛的应用,如语音助手、自动电话系统、语音搜索等。数字语音识别的主要技术包括语音特征提取和模式识别两个方面。
本文介绍了一种基于Matlab GUI的数字语音识别技术,采用小波变换(DWT)和梅尔频率倒谱系数(MFCC)进行语音特征提取,采用支持向量机(SVM)进行模式识别。同时我们使用GUI界面进行人机交互,使得使用者能够方便快捷地使用该数字语音识别系统进行语音识别任务。
- 预处理
在进行语音信号处理前需要先对信号进行预处理。预处理包括去噪、降噪、标准化等步骤。本文中采用了最小均值平滑(MMSE)算法进行去噪处理。
- 特征提取
2.1 DWT特征提取
小波变换是时频分析的重要工具,它能够将时域信号转化为在时频域上具有良好可分辨性的小波系数。因此,在语音特征提取中,小波变换是一种重要的工具。
本文中采用了小波包变换将语音信号转换为小波包系数,之后对小波包系数进行选择性保留和逆小波变换,得到了DWT域下的语音信号。
2.2 MFCC特征提取
MFCC是一种在音频处理领域广泛使用的特征提取方法,它利用了人耳对声音的感知特性,将声音信号转化为一组梅尔频率倒谱系数。MFCC作为语音识别中最常用的特征提取方法之一,被广泛应用于语音信号处理。
本文中采用MATLAB自带的mfcc函数进行MFCC特征提取,具体可见以下代码:
[n,m] = size(y);
fs=s
本文介绍了使用Matlab GUI结合小波变换(DWT)和梅尔频率倒谱系数(MFCC)进行数字语音识别的方法。通过SVM进行模式识别,并利用GUI实现友好的人机交互。实验使用Digits dataset,表明该系统具有高准确率和稳定性。
订阅专栏 解锁全文
251

被折叠的 条评论
为什么被折叠?



