google map 语音识别

没真的智能机的孩子你伤不起啊有木有!成天都是倒霉Symbian60啊有木有!上次超流量下载了Google Search for S60,里面神奇的有“语音搜索”……然后就是今天碰到android手机了,自带一个语音输入法啊!这准确率杆杆地!不过根据我多秒经验,S60的废柴API库绝对没有这么完美的语音识别(玩过诺基亚的应该都知道,待机状态长按右软件那个出来的是自带的识别功能),所以肯定Google留了一手!


(软件见[url]http://www.google.com/intl/zh-CN_ALL/mobile/google-mobile-app/[/url])

废话多了,现在看看Google的猥琐API之STT!(属于speech-api v1的recognize)
[url]http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN[/url]
不过使用不是那么简单的哦……
如何调用
要使用这个API,你得先有一些心理素质:面对倒霉的FLAC格式,因为这个API只支持FLAC格式的数据,杯具啊。

不过你找到了我的博客,那么你是幸福的,因为我已经为你准备了不少好东西了。(顺便说一句,如果要转载记得清楚地标注“来自http://blog.laobubu.net”,我信任你。)

现在看看如何请求数据:

【URL】[url]http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN[/url]
【方式】POST
【请求头】Content-Type:audio/x-flac; rate=16000
【POST】flac文件的数据
如果你人品大爆发,你成功了,可以得到类似这个的结果

{"status":0,"id":"54e1babccaa58682ffbb02ceb42aa47c-1",
"hypotheses":[{"utterance":"测试程序","confidence":0.8556527}]}不过不简单哦


实例:用于Python
#By laobubu.net

import urllib2
FILE='1.flac' #这里假设在当前文件夹下有一个叫1.flac的文件被识别
url = 'http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN'
audio=open(FILE,'rb').read()
headers = {'Content-Type' : 'audio/x-flac; rate=16000'}
req = urllib2.Request(url, audio, headers)
response = urllib2.urlopen(req)

print response.read().decode('UTF-8')头疼:FLAC文件格式
这里我长话短说,google的flac也有限制,22050 Hz+201kbps还正常,如果比这个大多了就不对了。

不过还有最要命的问题,怎么生成FLAC文件?

没关系,这里有救星:flac.exe包下载

[url]http://datastorage.laobubu.net/FLAC.zip[/url] (

具体使用方法是【flac.exe 文件.wav】这样在命令行调用即可,测试得知:不支持MP3等格式,但是支持基本的wav格式。

好了,你可以去制造你的app了,哈哈。

爱你:来自laobubu实验室的福音
为了方便,我写了一个python程序,放在Google App Engine上面,只要提交一个音频文件的URL(支持MP3、wav等常见格式),且文件不大,就可以得到结果了哦。(再次强调,跟你说的,上laobubu.net没错的)

API入口:[url]http://laobubumf.appspot.com/stt/[/url]
备用入口:[url]http://glab.laobubu.net/stt/[/url]

喜欢的话记得+1哦,当然捐赠我最不介意


转[url]http://blog.laobubu.net/546[/url] Google的语音识别API,支持各种语言


关于将其他格式的多媒体文件转换成flac格式可以参照:
[url]http://wujie2008.iteye.com/blog/1237788[/url]
### 下载并配置Vue3语音识别翻译项目 为了创建一个具有语音识别和翻译功能的Vue3应用程序,可以按照以下方法设置开发环境: #### 创建Vue3项目 使用`vue-cli`来初始化一个新的Vue3项目[^2]: ```bash npm install -g @vue/cli vue create my-speech-recognition-app cd my-speech-recognition-app ``` #### 安装依赖库 安装必要的JavaScript包以支持语音识别API以及用于调用外部翻译服务(如Google Translate API)的HTTP客户端axios: ```bash npm install web-speech-api-polyfill axios ``` 对于不完全支持Web Speech API的老式浏览器,web-speech-api-polyfill提供了一个回退方案。 #### 配置语音识别模块 在src目录下新建service/SpeechRecognitionService.js文件,并编写如下代码片段: ```javascript import {SpeechRecognition} from 'web-speech-api-polyfill'; const recognition = new (window.SpeechRecognition || window.webkitSpeechRecognition)(); recognition.lang = "en-US"; export default { start Recognition(callback){ recognition.onresult = function(event) { let transcript = Array.from(event.results) .map(result => result[0]) .map(result => result.transcript) .join(''); callback(transcript); }; recognition.start(); } } ``` 此部分利用了Web Speech API来进行实时音频输入转文字处理[^1]。 #### 实现翻译逻辑 同样,在同一级目录下建立TranslationService.js文件,加入下面的内容: ```javascript import axios from 'axios'; // 使用Axios发送POST请求到指定URL获取翻译后的文本数据 async function translateText(text, targetLanguageCode='zh-CN'){ try{ const response = await axios.post('https://translation.googleapis.com/language/translate/v2', null,{ params:{ q:text, target:targetLanguageCode, key:'YOUR_GOOGLE_TRANSLATE_API_KEY' } }); return response.data.data.translations[0].translatedText; }catch(error){ console.error(`Error during translation request:${error}`); throw error; } } export default translateText; ``` 注意替换`YOUR_GOOGLE_TRANSLATE_API_KEY`为你自己的谷歌云平台上的API密钥[^3]。 #### 组件集成 最后一步是在App.vue或其他适当位置引入上述两个服务类,并通过组合式API的方式将其挂载至data属性或methods函数中以便于模板内调用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值