别再手抄B站字幕了!AI两步自动提取,准确率高达99%!

该文章已生成可运行项目,

作者:唐叔在学习
专栏:唐叔学python
关键词:B站字幕提取、AI语音识别、DownKyi、FunASR、Python脚本、视频转文字、自动字幕、学习笔记、语音转文本、教程
一句话:还在重复“看视频→暂停→打字”的原始操作吗?这套方法让你彻底告别手打时代!

大家好,我是唐叔。

不知道你有没有这样的经历:在B站看到一个干货满满的视频,想把它整理成文字笔记,结果只能一遍遍暂停、回放、手打……效率低不说,还特别容易出错。

之前我也试过一些教程里推荐的方法,比如用 Parsevideo 解析音频再转文本,但下载速度实在太慢,完全不适合日常使用。

经过反复测试和优化,我终于总结出一套超高效、超精准的B站字幕提取方案,只需要两个步骤,就能轻松提取视频中的语音并转为文字,准确率高达99%

下面就分享给大家,记得点赞★收藏⭐,防止需要的时候找不到~

第一步:提取B站音频|使用 DownKyi 快速下载

这里推荐一款开源免费的工具——DownKyi,亲测下载速度快,支持批量操作,非常适合用来提取B站视频中的音频。

操作流程如下:

  1. 从 GitHub 下载并安装 DownKyi
  2. 打开软件,登录你的B站账号(扫码即可);
  3. 复制你要下载的B站视频链接,粘贴到软件中,点击【解析视频】;
  4. 选择你要下载的清晰度或音质,点击【下载选中项】即可。

DownKyi下载界面示意

✅ 如果你想试试其他音频提取软件,也可以参考这个B站工具推荐视频:五款哔哩哔哩视频下载工具,选择适合自己的那一款。

第二步:语音转文字|使用 FunASR 实现AI自动识别

拿到音频文件之后,我们就可以上“AI黑科技”了!

这里使用的是阿里开源的语音识别模型——FunASR,支持中英文、粤语、日语等多种语言,识别准确率非常惊人。

环境准备

请确保你的电脑已安装:

  • Python ≥ 3.8
  • PyTorch ≥ 1.13(必须支持CUDA,否则会报错)
  • torchaudio

你可以使用以下命令一键安装 FunASR:

git clone https://github.com/alibaba/FunASR.git && cd FunASR
pip3 install -e ./

如果自动安装不成功,也可以手动安装对应版本的 PyTorch。

识别脚本示例

安装完成之后,新建一个 Python 文件,复制下面这段代码:

from funasr import AutoModel
from funasr.utils.postprocess_utils import rich_transcription_postprocess

model_dir = "iic/SenseVoiceSmall"

model = AutoModel(
    model=model_dir,
    vad_model="fsmn-vad",
    vad_kwargs={"max_single_segment_time": 30000},
    device="cuda:0",
)

# 执行识别
res = model.generate(
    input="你的音频文件路径.mp3",  # 替换成你下载的音频路径
    cache={},
    language="auto",  # 自动检测语言,支持中英日韩等
    use_itn=True,
    batch_size_s=60,
    merge_vad=True,
    merge_length_s=15,
)

text = rich_transcription_postprocess(res[0]["text"])
print(text)

运行脚本,稍等片刻,视频里的语音内容就会被精准识别并输出为文本!

识别结果示意

⚠️ 常见问题与解决方法

1. DownKyi 刷不出登录二维码

如果你使用的是 GitHub 上的 1.6.1 版本,可能会遇到无法显示二维码的问题。

解决方法:下载这个补丁文件 → DownKyi.Core.dll.zip,解压后替换软件根目录中的同名文件即可。

2. 运行脚本报错:Torch not compiled with CUDA enabled

这说明你安装的 PyTorch 不支持 GPU 加速。

解决方法

  1. 在终端输入 nvidia-smi 查看你的显卡驱动和CUDA版本;
  2. PyTorch 官网 选择对应版本的安装命令,重新安装。

例如:

pip3 install torch torchaudio --index-url https://download.pytorch.org/whl/cu118

🎯 总结

通过 DownKyi + FunASR 这两款工具的搭配使用,我们实现了:

  • 高效下载B站视频音频;
  • 高准确率语音转写为文字;
  • 全自动处理,无需手动干预;
  • 支持多语言,适用性广。

无论你是做学习笔记、内容摘录,还是做自媒体字幕处理,这套方法都能帮你极大提升效率,彻底告别“手抄时代”。

如果觉得本文对你有帮助,欢迎点赞、收藏、转发!

你还用过哪些好用的AI工具?欢迎在评论区分享交流 👇

我们下期再见!


参考文章

本文章已经生成可运行项目
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

唐叔在学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值