深度学习在语音命令识别及相关应用中的实现
1. 基于深度学习的语音命令识别
1.1 加载预训练网络
使用预训练的深度学习模型进行流式音频的语音命令识别。该网络经过训练,能够识别以下语音命令:yes、no、up、down、left、right、on、off、stop 和 go,对于其他音频则分类为未知单词或背景噪声。
load("commandNet.mat")
labels = trainedNet.Layers(end).Classes'
1.2 加载音频信号
可以加载以下音频信号之一:噪声、有人说 stop 的音频或有人说 play 的音频。其中,stop 是网络能识别的命令,而 play 对网络来说是未知单词。
audioData =
;
sound(audioData{1},audioData{2})
1.3 提取听觉频谱图并分类
预训练网络以基于听觉的频谱图作为输入,使用 extractAuditorySpectrogram 函数提取频谱图,并根据频谱图对音频进行分类。
auditorySpectrogram = extractAuditorySpectrogram(audioData{1},audioData{2});
prediction = classify(trainedNet,au
超级会员免费看
订阅专栏 解锁全文
2013

被折叠的 条评论
为什么被折叠?



