【语音识别】电话按键语音识别(连续语音数字)【含Matlab源码 3416期】

本文介绍了使用Matlab实现的电话按键语音识别方法,通过过零率特征进行预处理和特征提取,包括读取wav文件、预处理、分帧、计算过零率等步骤。展示了部分源代码和运行结果,适用于Matlab2014a版本。

💥💥💥💥💥💥💥💥💞💞💞💞💞💞💞💞💞Matlab武动乾坤博客之家💞💞💞💞💞💞💞💞💞💥💥💥💥💥💥💥💥
🚀🚀🚀🚀🚀🚀🚀🚀🚀🚀🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚀🚀🚀🚀🚀🚀🚀🚀🚀🚀
在这里插入图片描述
🔊博主简介:985研究生,Matlab领域科研开发者;

🚅座右铭:行百里者,半于九十。

🏆代码获取方式:
优快云 Matlab武动乾坤—代码获取方式

更多Matlab语音处理仿真内容点击👇
Matlab语音处理(进阶版)

⛳️关注优快云 Matlab武动乾坤,更多资源等你来!!

⛄一、DTW简介

近年来,语音识别技术得到了长足的发展,已经广泛应用于各个领域。其中,电话按键语音识别是一种常见的应用场景。本文介绍了一种基于过零率特征实现电话按键语音识别的方法, 并提供了相应的Matlab源代码。

1 概述
电话按键语音识别是指将电话拨号声音转换成数字,以及将数字转换成电话拨号声音。其实质是对时域信号进行数字信号处理,从而实现语音信号的自动识别。
本文所介绍的基于过零率特征实现的电话按键语音识别方法,是利用语音信号在正常人说话时无法避免的一种现象。这种现象就是语音信号中存在着大量的过零点。根据过零点的数量和分布情况可以判断出语音信号的特征。

2 算法介绍
该算法主要包含以下几个步骤:
(1)读取语音信号(wav格式) 。
(2)对语音信号进行预处理,如去噪,去除静音段等。
(3)分帧:将语音信号分成若干个长度相等的帧,每帧的长度一般为20ms到30ms之间。
(4)计算每帧的过零率:过零率即信号通过0的次数。

⛄二、部分源代码

clear all
clc
[x0,Fs]=audioread(‘1234567890.wav’);
%sound(x0,Fs);
N=length(x0); %采样点
k=(0:N-1);
f=(k/N-1/2)*Fs;
X0=fft(x0);
figure
subplot(2,1,1),plot(x0)
title(‘原始按键音(时域)’),xlabel(‘t’),ylabel(‘振幅’)
subplot(2,1,2),plot(f,abs(fftshift(X0)));xlim([0,4000])
title(‘原始按键音(频域)’),xlabel(‘f/Hz’),ylabel(‘幅度’)
% -----------------------------------------带通滤波
Hd=band_pass; %带通滤波器
x1=filter(Hd,x0); %滤波
%sound(x1,Fs)
X1=fft(x1);
figure
subplot(2,1,1),plot(x1)
title(‘滤波后的按键音(时域)’),xlabel(‘t’),ylabel(‘振幅’)
subplot(2,1,2),plot(f,abs(fftshift(X1))),xlim([0,2000])
title(‘滤波后的按键音(频域)’),xlabel(‘f/Hz’),ylabel(‘幅度’)
% -------------------------------------------过零率与短时能量
len=2000; %帧长
d=50; %帧重叠样点长
s=fra(len,len-d,x1); %分帧,s为帧数
es=s.^2; %一帧内各样点能量
energy=sum(es,2); %一帧的能量,行求和
zcr=zcro(s); %求过零率
figure
subplot(3,1,1),plot(x1)
title(‘按键音1234567890’),ylabel(‘幅度’)
subplot(3,1,2),plot(energy)
title(‘短时能量’),xlabel(‘帧编号’),ylabel(‘E’)
subplot(3,1,3),plot(zcr)
title(‘信号过零率’),xlabel(‘帧编号’),ylabel(‘过零次数’)
%-------------------------------------------端点检测
flag=energy; %有效信号标志
Ethresh=0.02; %短时能量阈值
flag(find(energy>Ethresh))=1;
flag(find(energy<=Ethresh))=0;
desired_signal=[]; %有效信号标志
desired_signal(1)=0;
for i=1:length(flag)
for j=2:i
if flag(j-1)*flag(j)==0
desired_signal(i)=0;
else
desired_signal(i)=1;
end
end
end

⛄三、运行结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

⛄四、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019.
[2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019.

3 备注
简介此部分摘自互联网,仅供参考,若侵权,联系删除

🍅 仿真咨询
1 各类智能优化算法改进及应用

生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化

2 机器学习和深度学习方面
卷积神经网络(CNN)、LSTM、支持向量机(SVM)、最小二乘支持向量机(LSSVM)、极限学习机(ELM)、核极限学习机(KELM)、BP、RBF、宽度学习、DBN、RF、RBF、DELM、XGBOOST、TCN实现风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断

3 图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知

4 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、车辆协同无人机路径规划、天线线性阵列分布优化、车间布局优化

5 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配

6 无线传感器定位及布局方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化

7 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化

8 电力系统方面
微电网优化、无功优化、配电网重构、储能配置

9 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长

10 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值