深度学习语音命令识别模型训练与Ambisonic插件生成
一、深度学习语音命令识别模型训练
1.1 概述
此示例展示了如何训练一个深度学习模型,用于检测音频中语音命令的存在。使用语音命令数据集训练卷积神经网络,以识别一组命令。
1.2 运行设置
可以通过设置 speedupExample 来快速运行示例或完整运行示例:
speedupExample = ;
rng default
1.3 数据加载
使用Google语音命令数据集,下载并解压数据:
downloadFolder = matlab.internal.examples.downloadSupportFile("audio","google_speech.zip");
dataFolder = tempdir;
unzip(downloadFolder,dataFolder)
dataset = fullfile(dataFolder,"google_speech");
1.4 数据增强
网络不仅要能识别不同的语音单词,还要能检测音频输入是否为静音或背景噪音。使用 augmentDataset 函数利用数据集中背景文件夹的长音频文件创建一秒的背景噪音片段,并将其分配到训练和验证文件夹:
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



