树莓派上的语音处理:关键词识别与去混响技术实现
1. 树莓派上的关键词识别代码生成
1.1 示例概述
本示例展示了如何在树莓派上使用双向长短期记忆(BiLSTM)网络和梅尔频率倒谱系数(MFCC)特征提取进行关键词识别的代码生成。借助支持深度学习的 MATLAB Coder,可在树莓派上生成独立的可执行文件(.elf)。MATLAB 文件(.mlx)与生成的可执行文件通过异步用户数据报协议(UDP)进行通信。输入的语音信号通过时间示波器显示,检测到的关键词“YES”会被蓝色矩形框标记。
1.2 示例要求
- MATLAB Coder 深度学习支持包接口
- 支持 NEON 扩展的 ARM 处理器
- ARM 计算库版本 20.02.1(在目标 ARM 硬件上)
- 编译器和库的环境变量
1.3 使用预训练网络进行关键词识别
1.3.1 参数设置
fs = 16e3;
windowLength = 512;
overlapLength = 384;
hopLength = windowLength - overlapLength;
numHopsPerUpdate = 16;
maskLength = hopLength * numHopsPerUpdate;
1.3.2 创建特征提取对象
afe = audioFeatu
树莓派语音处理:关键词识别与去混响实现
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



