语音命令识别与时频掩蔽技术详解
1. 基于 Intel MKL-DNN 的语音命令识别代码生成
1.1 前提条件
要在 Intel 处理器上部署语音命令识别的特征提取和卷积神经网络(CNN),需要满足以下条件:
- MATLAB Coder 深度学习库接口支持包
- 支持 Intel Advanced Vector Extensions 2 (Intel AVX2) 的 Xeon 处理器
- Intel 深度学习数学核心库(MKL-DNN)
- 配置 Intel MKL-DNN 的环境变量
1.2 MATLAB 中的流式演示
1.2.1 参数定义
使用与训练语音命令识别模型相同的特征提取和分类参数。定义采样率、分类率和每帧输入的音频样本数等参数:
fs = 16000;
classificationRate = 20;
samplesPerCapture = fs/classificationRate;
segmentDuration = 1;
segmentSamples = round(segmentDuration*fs);
frameDuration = 0.025;
frameSamples = round(frameDuration*fs);
hopDuration = 0.010;
hopSamples = round(hopDuration*fs);
1.2.2 特征提取器创建
创建一个 audioFeatureEx
超级会员免费看
订阅专栏 解锁全文
289

被折叠的 条评论
为什么被折叠?



