科大讯飞python

最新推荐文章于 2024-09-21 17:07:20 发布

原创

最新推荐文章于 2024-09-21 17:07:20 发布 · 2.1k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python科大讯飞

该博客展示了如何使用Python进行语音识别。通过读取wav文件，将其转化为base64编码，然后利用IFLYTEK的API进行语音识别。主要涉及了urllib, base64, hashlib等库，以及API调用的参数设置，如appid, 时间戳, 参数加密等。

#!/usr/bin/python
# -*- coding: UTF-8 -*-
# import urllib2
import time
import urllib
import json
import hashlib
import base64
import urllib.request
import urllib.parse


def main():
    f = open("temp.wav", 'rb')  # rb表示二进制格式只读打开文件
    file_content = f.read()
    # file_content 是二进制内容，bytes类型
    # 由于Python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。
    # 如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes
    # 以Unicode表示的str通过encode()方法可以编码为指定的bytes
    base64_audio = base64.b64encode(file_content)  # base64.b64encode()参数是bytes类型，返回也是bytes类型
    body = urllib.parse.urlencode({'audio': base64_audio})

    url = 'http://api.xfyun.cn/v1/service/v1/iat'
    api_key = '7900ca5ce433f66757d2695d72753a8d'
    param = {"engine_type": "sms16k", "aue": "raw"}

    x_appid = '7847796e'
    x_param = base64.b64encode(json.dumps(param).replace(' ', '').encode('utf-8'))  # 改('''')
    # 这是3.x的用法，因为3.x中字符都为unicode编码，而b64encode函数的参数为byte类型，
    # 所以必须先转码为utf-8的bytes
    x_param = str(x_param, 'utf-8')

    x_ti