android语音识别 android.speech 包分析

最新推荐文章于 2024-01-19 09:30:18 发布

转载最新推荐文章于 2024-01-19 09:30:18 发布 · 698 阅读

文章标签：

#android #service #google #callback #search #引擎

语音识别专栏收录该内容

1 篇文章

订阅专栏

本文深入探讨了Android平台上的语音识别技术，包括通过RecognizerIntent进行的基本交互、自定义RecognitionService的方法及其实现细节、以及如何使用SpeechRecognizer来启动语音识别过程。此外还提到了一些开源库和非Google风格的识别方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原创作品，允许转载，转载时请务必以超链接形式标明文章原始出处、作者信息和本声明。否则将追究法律责任。 http://mengxx.blog.51cto.com/2502718/767085

android voice recognition，语音识别作为Service实现。语音识别API在android.speech中 API大致分成应用端API和service端API

RecognizerIntent

顾名思义，在自己的程序中，需要语音识别了，发出这个intent，如果已经安装了google voice search应用，谷歌的activity,service就会跳出来帮你。 http://download.youkuaiyun.com/source/2591401有三个例子。例子1基本就实现了这样一个应用。例子1实际上很简单，就靠RecognizerIntent，intent发出后，相应的service会处理intent。基本上是借鉴了google官方sample：http://developer.android.com/resources/articles/speech-input.html 和 http://developer.android.com/resources/samples/ApiDemos/src/com/example/android/apis/app/VoiceRecognition.html

（运行例子1的前提是，google voice search应用已经安装，这样确保Service已经安装了）注意，需要微调程序中的RecognizerIntent的三个参数，可以得到不同的运行效果，简单，参考javadoc即可。

  Intent intent = new Intent(RecognizerIntent.ACTION_WEB_SEARCH);  

intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, 
 
RecognizerIntent.LANGUAGE_MODEL_FREE_FORM);

以上是最简单的方式，只需要RecognizerIntent一个类就搞定

自己实现RecognitionService

如果要自己做一个识别引擎Service，是可以的。Android提供了RecognitionService抽象类识别引擎作为Service存在，要实现这个抽象类. This RecognitionService class should be extended only in case you wish to implement a new speech recognizer.

Android SDK提供了一个sample VoiceRecognitionService extends RecognitionService，是一个假的引擎，识别结果固定为abc或者123。这个引擎不读取麦克风，也不含麦克风dialog界面。稍候在SpeechRecognizer处介绍如何使用这个假service.

RecognitionService比较朴素，提供三个方法：

  abstract void   onStartListening(Intent recognizerIntent, RecognitionService.Callback listener)  
Notifies the service that it should start listening for speech. 开始识别，intent发过来了 
 
abstract void   onStopListening(RecognitionService.Callback listener) 
Notifies the service that it should stop listening for speech. 结束识别 
 
abstract void   onCancel(RecognitionService.Callback listener)  
Notifies the service that it should cancel the speech recognition. 取消识别

RecognitionService是无状态的，不能并行开始识别多个音频流，三个方法必须按照开始-->结束/取消，再开始-->结束/取消，这样顺序调用，否则报错。

谷歌的Service实现，不开源

AOSP里面没有实现RecognitionService的代码。所以默认的AOSP编出来的android SDK都是不带语言识别Service的，SDK桌面的google search widget没有麦克风，就说明识别Service还没装。

google自己实现了RecognitionService，装了voicesearch 2.1.4之后（一般手机都已经预置），桌面的google search widget也会出现小麦克了点击小麦克出现"speak now"对话框。同时settings voice input output的识别引擎选择框会出现google的选项。谷歌的service叫com.google.android.voicesearch.RecognitionService 这个程序也不开源，无法深度定制谷歌那个"speak now"对话框。