Google Speech Recognition（ASR）

使用Google ASR进行语音识别

最新推荐文章于 2025-02-26 14:30:09 发布

原创

最新推荐文章于 2025-02-26 14:30:09 发布 · 3.1k 阅读

1 ·

CC 4.0 BY-SA版权

Google的语音识别API尚未正式发布，主要依赖flac格式的音频输入。开发者可以利用ffmpeg库进行音频格式转换，并结合json、httpclient、httpcore和commons-logging等库进行接口调用。该API的相关资料有限，但有部分开发介绍和Chrome 11 API的说明可供参考。

Google的语音识别API至今仍未正式发布，没有很详细的开发文档，只提供一个Service 服务。 Google ASR的API需要提供flac格式的音频，格式转换，可以使用ffmpeg库来处理。当中涉及到具体的库有：json，httpclient， httpcore和commons-logging包。具体代码如下：

import java.io.*;
import java.net.MalformedURLException;

import org.apache.http.HttpEntity;
import org.apache.http.HttpHost;
import org.apache.http.HttpResponse;
import org.apache.http.client.HttpClient;
import org.apache.http.client.methods.HttpPost;
import org.apache.http.conn.params.ConnRoutePNames;
import org.apache.http.entity.InputStreamEntity;
import org.apache.http.impl.client.DefaultHttpClient;
import org.apache.http.params.HttpProtocolParams;
import org.apache.http.util.EntityUtils;
import org.json.simple.JSONArray;
import org.json.simple.JSONObject;
import org.json.simple.parser.JSONParser;
import org.json.simple.parser.ParseException;


public class voiceRecognit