最近尝试在树莓派上完成一些语音方向的应用,例如像语音唤醒和关键词的识别,前期搜索了一下,可以选择的国内平台有百度语音,科大讯飞, 云之声等。这几家都有自己的开发者开放平台都提供了语音唤醒,语音关键词识别,语音合成等服务。
先尝试了一下百度语音的开发平台,平台提供了常用的语音应用,但是离线识别的话只提供了手机Android和iOS平台的开发SDK,在线识别倒是提供了REST API可以调用在线服务,但是考虑到网络的影响,最后还是放弃了百度平台。
又看了一下云之声平台的内容,发现和百度提供的类似,也都是提供手机平台的方案,或者有现成的硬件解决方案。
最后选择了科大讯飞的语音平台(科大讯飞语音平台),之前也试用过科大讯飞出的手机语音输入法,效果还是不错的。登录到科大讯飞的开发者平台,发现几家的平台流程都大同小异,注册开发者,申请应用appid,下载的SDK内部填写上appid,就可以调用了。
科大讯飞的语音技术平台提供了好多语音技术的应用,除了传统的语音唤醒,语音关键词识别,语音合成。还有一下特别有意思的语音应用像:语音读写的语记,声纹识别,语音评测。不过都是基于手机平台的,树莓派没有机会试用…..
回到树莓派的语音识别,我使用的是树莓派3,装的系统是Raspbian-jessie,Raspbian的基础是Debian操作系统,自然希望有Linux平台的语音识别方案,好在科大讯飞提供了各种平台的解决方案,对于语音唤醒,语音关键词识别,语音合成都有linux下的解决方案,下载试用SDK,在电脑上测试试用正常,识别效果和语音合成的效果都很不错。但是在移植到树莓派上时,发现官网提供的SDK内没有包含树莓派的运行库,由于PC和树莓派的CPU架构不同,求助于科大讯飞的技术支持人员,填写完需求后,在2天内就发来了树莓派需要的运行库,在树莓派上的运行结果也是不错的,但是限于树莓派的硬件性能,程序的响应时间比较长,语音合成的花费的时间也长
语音识别技术在树莓派平台上的使用
最新推荐文章于 2024-05-26 17:11:56 发布