python音频转文字

import wave
import json
from vosk import Model, KaldiRecognizer

# 音频文件路径,需替换成实际音频文件的路径
audio_file_path = 'output.wav'
# 模型路径
model_path = r"C:\Users\13940\voskmodels\vosk-model-cn-0.22"

# 打开音频文件
wf = wave.open(audio_file_path, "rb")

# 检查音频文件参数
if wf.getnchannels() != 1 or wf.getsampwidth() != 2 or wf.getcomptype() != "NONE":
    print("音频文件必须是单声道、16位、无压缩的 WAV 格式。")
    exit(1)

# 加载 Vosk 模型
model = Model(model_path)
rec = KaldiRecognizer(model, wf.getframerate())

while True:
    data = wf.readframes(4000)
    if len(data) == 0:
        break
    if rec.AcceptWaveform(data):
        result = json.loads(rec.Result())
        print(result["text"])

# 获取最终识别结果
final_result = json.loads(rec.FinalResult())
print(final_result["text"])

# 关闭音频文件
wf.close()

语言模型下载地址https://alphacephei.com/vosk/models

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

adfass

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值