38、深度学习在语音命令识别及相关应用中的实现

深度学习在语音命令识别及相关应用中的实现

1. 基于深度学习的语音命令识别

1.1 加载预训练网络

使用预训练的深度学习模型进行流式音频的语音命令识别。该网络经过训练,能够识别以下语音命令:yes、no、up、down、left、right、on、off、stop 和 go,对于其他音频则分类为未知单词或背景噪声。

load("commandNet.mat")
labels = trainedNet.Layers(end).Classes'

1.2 加载音频信号

可以加载以下音频信号之一:噪声、有人说 stop 的音频或有人说 play 的音频。其中,stop 是网络能识别的命令,而 play 对网络来说是未知单词。

audioData = 
;
sound(audioData{1},audioData{2})

1.3 提取听觉频谱图并分类

预训练网络以基于听觉的频谱图作为输入,使用 extractAuditorySpectrogram 函数提取频谱图,并根据频谱图对音频进行分类。

auditorySpectrogram = extractAuditorySpectrogram(audioData{1},audioData{2});
prediction = classify(trainedNet,au
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值