利用线程池+回调+百度语音识别来批量实现语音识别

最新推荐文章于 2024-10-28 15:44:24 发布

原创最新推荐文章于 2024-10-28 15:44:24 发布 · 586 阅读

0 ·

CC 4.0 BY-SA版权

人工智能专栏收录该内容

13 篇文章

订阅专栏

本文介绍了一种利用Python和百度AI平台的AipSpeech模块进行语音识别的方法。通过多线程处理，该方案能批量识别.wav格式的音频文件，并返回识别结果。文章详细介绍了如何设置APP_ID、API_KEY和SECRET_KEY，以及如何读取和解析音频文件。

#!/usr/bin/python3
# -*- coding: utf-8 -*-

from aip import AipSpeech
import os
import sys
from concurrent.futures import ThreadPoolExecutor
import shutil

""" 你的 APPID AK SK """
APP_ID = 'xxx'
API_KEY = 'xxx'
SECRET_KEY = 'xxx'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)


# 读取文件
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()


def get_content(filepath):
    msg = client.asr(get_file_content(filepath), 'wav', 8000, {'dev_pid': 1536, })
    return {'filepath': filepath, 'msg': msg}


def parse_res(res):
    res = res.result()
    try:
        msg = res['msg']
        filepath = res['filepath']
        if msg['err_no']:
            print(filepath, msg['err_no'])
        else:
            content = msg['result'][0]
            print(filepath, content)
    except Exception:
        print(res)


_, inpath = sys.argv

pool = ThreadPoolExecutor(10)
for filename in os.listdir(inpath):
    filepath = os.path.join(inpath, filename)
    # print(filepath)
    pool.submit(get_content, filepath).add_done_callback(parse_res)

pool.shutdown()