利用线程池+回调+百度语音识别来批量实现语音识别

本文介绍了一种利用Python和百度AI平台的AipSpeech模块进行语音识别的方法。通过多线程处理,该方案能批量识别.wav格式的音频文件,并返回识别结果。文章详细介绍了如何设置APP_ID、API_KEY和SECRET_KEY,以及如何读取和解析音频文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#!/usr/bin/python3
# -*- coding: utf-8 -*-

from aip import AipSpeech
import os
import sys
from concurrent.futures import ThreadPoolExecutor
import shutil

""" 你的 APPID AK SK """
APP_ID = 'xxx'
API_KEY = 'xxx'
SECRET_KEY = 'xxx'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)


# 读取文件
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()


def get_content(filepath):
    msg = client.asr(get_file_content(filepath), 'wav', 8000, {'dev_pid': 1536, })
    return {'filepath': filepath, 'msg': msg}


def parse_res(res):
    res = res.result()
    try:
        msg = res['msg']
        filepath = res['filepath']
        if msg['err_no']:
            print(filepath, msg['err_no'])
        else:
            content = msg['result'][0]
            print(filepath, content)
    except Exception:
        print(res)


_, inpath = sys.argv

pool = ThreadPoolExecutor(10)
for filename in os.listdir(inpath):
    filepath = os.path.join(inpath, filename)
    # print(filepath)
    pool.submit(get_content, filepath).add_done_callback(parse_res)

pool.shutdown()

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值