基于ESP32的机器学习语音应用与Edge Impulse平台实践
1. 语音应用开发基础
1.1 afe_config_t结构与功能
afe_config_t结构包含很多字段,大部分字段的含义都很直观。AFE具备语音活动检测(VAD)功能,用于检测人类语音的存在;自动增益控制(AGC)用于控制音频峰值幅度;脉冲编码调制(PCM)配置用于定义音频采样。
1.2 AppSpeech类的使用
我们已经准备好AppSpeech类,可以在main/speech_ex.cpp中实例化它:
#include "AppSpeech.hpp"
namespace
{
app::AppSpeech m_app_sp;
}
extern "C" void app_main()
{
m_app_sp.start();
}
在app_main函数中,我们只需调用m_app_sp对象的start函数来启动语音命令检测。
1.3 应用测试
使用idf.py工具进行应用测试,具体命令如下:
$ idf.py flash monitor
执行该命令后,会输出一系列日志信息,包括芯片类型检测、模型加载、语音识别相关的初始化信息等。在测试过程中,应用会检测唤醒词,然后检测语音命令,例如:
I (843) speech
超级会员免费看
订阅专栏 解锁全文
1836

被折叠的 条评论
为什么被折叠?



