嵌入式开发:语音识别
文章平均质量分 73
基于TI开发板的嵌入式语音识别系统开发,板子为AM67A
匹诺曹得鼻炎
没有秃头,只有热爱
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于AM67A的嵌入式语音识别开发(五)--QT项目集成和切换指令解析(精确查找)
本文介绍了将语音识别模型Vosk集成到实际项目的完整流程。首先验证了模型在终端设备运行的可行性,随后详细说明了项目对接的三个关键步骤:1)前期准备,包括配置项目路径和模型文件;2)语音识别核心代码移植,展示了音频解析和文本转换的实现;3)设计语音助手交互控件,包含UI布局、音频组件初始化及操作流程控制。测试采用点击触发方式,实现了从录音、音频处理到文本转换的完整功能链路,为后续集成全局语音唤醒等高级功能奠定了基础。原创 2025-11-20 15:06:06 · 280 阅读 · 0 评论 -
基于AM67A的嵌入式语音识别开发(四)--QT实现
嵌入式语音识别实现方案 本文介绍了基于Vosk API和QT框架的嵌入式语音识别实现方案。研究发现当前嵌入式板卡对图像处理的支持优于语音识别,因此选择开源Vosk模型作为核心,其特点包括提供C语言API、轻量化部署和多语言支持。实现过程分为三个主要步骤: 环境搭建:配置Vosk库文件和中文语音模型,设计项目目录结构 QT工程配置:设置.pro文件路径,实现音频加载和识别功能,包括WAV文件解析和JSON结果提取 界面设计:创建包含标题、文本框和功能按钮的GUI界面,并应用自定义样式表优化视觉效果 该方案特别原创 2025-09-15 15:53:37 · 859 阅读 · 0 评论 -
基于AM67A的嵌入式语音识别功能实现(二):模型训练及转换onnx格式
本文介绍了基于MASR中文语音识别项目的部署与验证过程。作者选用AISHELL-1数据集,因设备限制将数据量缩减至7000条样本进行训练,在GTX 1060显卡上运行24小时后获得70%准确率的基准模型。通过测试样本验证了模型效果,展示了语音识别结果与真实文本的对比。最后,文章详细说明了将训练好的PyTorch模型转换为ONNX格式的完整代码流程,包括输入输出维度设置等关键细节。该项目为中文语音识别提供了一个可行的实现方案,为后续优化奠定了基础。原创 2025-07-09 22:13:37 · 220 阅读 · 0 评论 -
基于AM67A的嵌入式语音识别功能实现(三):虚拟机端编译及验证
摘要: 本文介绍了三种在TIDL SDK中编译和验证ONNX模型的方案: .prototxt配置方式:旧版方法,需配置prototxt文件指定模型参数,执行tidl_model_import.out进行编译,但可能存在路径问题。 YAML模板导入:新版推荐方法,通过model_list.yaml配置模型路径、量化选项等,运行run_import_on_pc.py生成部署文件。 TVM+Python编译:适用于语音等序列模型,需配置TVM环境,调用tvm.contrib.tidl.compile编译模型,生成原创 2025-07-09 18:05:46 · 1116 阅读 · 0 评论 -
基于AM67A的嵌入式语音识别功能实现(一):镜像烧写和虚拟机编译环境搭建
**摘要:**本文详细介绍了TI AM67A开发板的镜像烧写与配置流程,包括SD卡烧写、启动模式设置、串口连接和网络配置。同时提供了虚拟机编译环境搭建的完整步骤,重点解决Docker构建中的常见问题(如网络超时、依赖冲突等),并给出优化方案(国内镜像源、手动安装依赖等)。通过SOC环境变量设置完成工具链配置,为后续模型部署提供基础环境支持。原创 2025-07-09 16:03:22 · 867 阅读 · 0 评论 -
基于AM67A的嵌入式语音识别功能实现(前言)
摘要:本文分享了在注塑机控制器中集成AI功能的开发经验。项目包含语音识别(语音转文本、指令识别、人机交互)和图像处理两大模块,旨在提升设备智能化水平。开发过程中面临硬件操作生疏、外文文档查阅、功能自主开发等挑战,通过系统学习成功实现功能部署。文章还探讨了车间收音优化、云数据库搭建等后续技术难点,为工业设备智能化转型提供了实践参考。(150字)原创 2025-07-08 21:41:45 · 299 阅读 · 0 评论
分享