语音方案比对介绍
语音交互是现今应用最多的智能交互方式,在人工智能越来越火的当下应用十分广泛,所以特别针对车内环境,在驾驶员安心驾驶的时候,用语音可以安全的进行操控,所以针对公司的车联网的业务需求,我做了一个语音方案的研究和比对。
语音需求
整体来说语音需求,选择的语音方案至少要满足语音唤醒,语音合成,语义解析三大基础功能
1. 语音唤醒: 能够通过唤醒词,唤醒语音助手,进行后续用户语义的识别,免去手动点击唤醒的操作
2. 语音合成: 俗称TTS(Text To Speech),支持将文本转换成语音播报出来
3. 语义解析: 支持将用户输入的语音,转换成文本,并进行相应的分析,定位到相应的场景,关键字 返回结果帮助我们定位到用户需求。
例如:“导航到深圳北站”,除了解析语音返回整句文本之外,还需要定位到这是地图场景,关键字是POI点深圳北站
语音方案
现今市面上比较常用的语音方案有:腾讯云语音,讯飞语音,百度语音,思必驰,云知声,同行者,搜狗语音云
- 同行者并不同于其他只做语音方案,它提供的更多的是智能设备的整套系统方案,有对外开放SDK,但需要走商务渠道才能试用
- 思必驰 主要针对场景进行制定化开发,无对外开放平台进行试用,需要走商务合作
所以暂时着重比对介绍一下腾讯云语音,讯飞语音,百度语音, 云知声,搜狗语音云