语音识别技术在树莓派平台上的使用

最新推荐文章于 2024-05-26 17:11:56 发布

落雨听轩

最新推荐文章于 2024-05-26 17:11:56 发布

阅读量6.5k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：树莓派文章标签： sdk 语音识别树莓派

本文链接：https://blog.youkuaiyun.com/qq_28867509/article/details/52012461

本文介绍了在树莓派3上使用科大讯飞语音识别技术的过程，包括遇到的问题及解决方案。由于科大讯飞官方SDK未直接支持树莓派，作者通过获取特定运行库成功在树莓派上实现语音识别，但受限于硬件性能，响应时间较长。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近尝试在树莓派上完成一些语音方向的应用，例如像语音唤醒和关键词的识别，前期搜索了一下，可以选择的国内平台有百度语音，科大讯飞，云之声等。这几家都有自己的开发者开放平台都提供了语音唤醒，语音关键词识别，语音合成等服务。
先尝试了一下百度语音的开发平台，平台提供了常用的语音应用，但是离线识别的话只提供了手机Android和iOS平台的开发SDK，在线识别倒是提供了REST API可以调用在线服务，但是考虑到网络的影响，最后还是放弃了百度平台。
又看了一下云之声平台的内容，发现和百度提供的类似，也都是提供手机平台的方案，或者有现成的硬件解决方案。
最后选择了科大讯飞的语音平台(科大讯飞语音平台)，之前也试用过科大讯飞出的手机语音输入法，效果还是不错的。登录到科大讯飞的开发者平台，发现几家的平台流程都大同小异，注册开发者，申请应用appid，下载的SDK内部填写上appid，就可以调用了。
这里写图片描述
科大讯飞的语音技术平台提供了好多语音技术的应用，除了传统的语音唤醒，语音关键词识别，语音合成。还有一下特别有意思的语音应用像:语音读写的语记，声纹识别，语音评测。不过都是基于手机平台的，树莓派没有机会试用…..
回到树莓派的语音识别，我使用的是树莓派3，装的系统是Raspbian-jessie，Raspbian的基础是Debian操作系统，自然希望有Linux平台的语音识别方案，好在科大讯飞提供了各种平台的解决方案，对于语音唤醒，语音关键词识别，语音合成都有linux下的解决方案，下载试用SDK，在电脑上测试试用正常，识别效果和语音合成的效果都很不错。但是在移植到树莓派上时，发现官网提供的SDK内没有包含树莓派的运行库，由于PC和树莓派的CPU架构不同，求助于科大讯飞的技术支持人员，填写完需求后，在2天内就发来了树莓派需要的运行库，在树莓派上的运行结果也是不错的，但是限于树莓派的硬件性能，程序的响应时间比较长，语音合成的花费的时间也长