PC端语音识别简介

最新推荐文章于 2025-08-13 16:10:35 发布

原创

最新推荐文章于 2025-08-13 16:10:35 发布 · 6.6k 阅读

3 ·

CC 4.0 BY-SA版权

本文介绍了PC端的语音识别技术，主要包括云语音识别和离线语音识别。云识别如html5语音输入标签和谷歌输入法依赖浏览器支持，识别率受限。科大讯飞的语音云提供较好的中文识别服务，但Flash版存在一些问题。离线识别以IBM ViaVoice为代表，提供高识别率和个性化训练，但安装和设置复杂，适用于个人电脑。目前，精确识别尚未普及，可能需要定制或深入研究以满足不同需求。

语音识别：

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。它主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别区别于声纹识别，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的发展可参考http://baike.baidu.com/view/652891.htm。

以下主要介绍PC端语音识别产品，现行产品还是分为两种：云语音识别和离线语音识别。

云语音识别：

1. html5语音输入标签直接支持语音输入，浏览器中的语音输入，未来语音识别的标准，由于是基于Google的语音库的，因此识别率还较低，需要浏览器支持（目前chrome 11及以上版本支持较好，IE和Firefox等暂不支持），实例：WebQQ中在chrome中打开有使用该语音识别 http://web.qq.com/

2. PC端的google输入法语音输入，这个和应该和chrome中的类似，都是要调用google的云语音库，由于google被墙的原因，再加上google更擅长处理英文，所以识别效果也还一般。

3. 科大讯飞语音云，中文语音合成和识别，目前国内较为成熟的中文语音识别，主要在移动端发力，最近也已经在PC端开始布局，java版，windows版，linux版，还有简单发布的半官方的flash版本（前面的三个PC版都是官网直接发布的，flash的截至2012-12-07还是在官方论坛上通过迅雷网盘发布，有失效时间，因此可能更新也会比较频繁），Web端开发需要flash支持或开发浏览器插件。

（1）研究了下Flash的控