别再手抄B站字幕了！AI两步自动提取，准确率高达99%！

最新推荐文章于 2025-10-23 01:23:24 发布

原创最新推荐文章于 2025-10-23 01:23:24 发布 · 2.1k 阅读

32 ·

CC 4.0 BY-SA版权

文章标签：

#B站字幕提取 #AI语音识别 #DownKyi #FunASR

唐叔学Python 同时被 2 个专栏收录

42 篇文章

订阅专栏

唐叔学AI

11 篇文章

订阅专栏

该文章已生成可运行项目，

作者：唐叔在学习
专栏：唐叔学python
关键词：B站字幕提取、AI语音识别、DownKyi、FunASR、Python脚本、视频转文字、自动字幕、学习笔记、语音转文本、教程
一句话：还在重复“看视频→暂停→打字”的原始操作吗？这套方法让你彻底告别手打时代！

大家好，我是唐叔。

不知道你有没有这样的经历：在B站看到一个干货满满的视频，想把它整理成文字笔记，结果只能一遍遍暂停、回放、手打……效率低不说，还特别容易出错。

之前我也试过一些教程里推荐的方法，比如用 Parsevideo 解析音频再转文本，但下载速度实在太慢，完全不适合日常使用。

经过反复测试和优化，我终于总结出一套超高效、超精准的B站字幕提取方案，只需要两个步骤，就能轻松提取视频中的语音并转为文字，准确率高达99%！

下面就分享给大家，记得点赞★收藏⭐，防止需要的时候找不到～

文章目录

第一步：提取B站音频｜使用 DownKyi 快速下载

这里推荐一款开源免费的工具——DownKyi，亲测下载速度快，支持批量操作，非常适合用来提取B站视频中的音频。

操作流程如下：

从 GitHub 下载并安装 DownKyi；
打开软件，登录你的B站账号（扫码即可）；
复制你要下载的B站视频链接，粘贴到软件中，点击【解析视频】；
选择你要下载的清晰度或音质，点击【下载选中项】即可。

DownKyi下载界面示意

✅ 如果你想试试其他音频提取软件，也可以参考这个B站工具推荐视频：五款哔哩哔哩视频下载工具，选择适合自己的那一款。

第二步：语音转文字｜使用 FunASR 实现AI自动识别

拿到音频文件之后，我们就可以上“AI黑科技”了！

这里使用的是阿里开源的语音识别模型——FunASR，支持中英文、粤语、日语等多种语言，识别准确率非常惊人。

环境准备

请确保你的电脑已安装：

Python ≥ 3.8
PyTorch ≥ 1.13（必须支持CUDA，否则会报错）
torchaudio

你可以使用以下命令一键安装 FunASR：

git clone https://github.com/alibaba/FunASR.git && cd FunASR
pip3 install -e ./

如果自动安装不成功，也可以手动安装对应版本的 PyTorch。

识别脚本示例

安装完成之后，新建一个 Python 文件，复制下面这段代码：

from funasr import AutoModel
from funasr.utils.postprocess_utils import rich_transcription_postprocess

model_dir = "iic/SenseVoiceSmall"

model = AutoModel(
    model=model_dir,
    vad_model="fsmn-vad",
    vad_kwargs={"max_single_segment_time": 30000},
    device="cuda:0",
)

# 执行识别
res = model.generate(
    input="你的音频文件路径.mp3",  # 替换成你下载的音频路径
    cache={},
    language="auto",  # 自动检测语言，支持中英日韩等
    use_itn=True,
    batch_size_s=60,
    merge_vad=True,
    merge_length_s=15,
)

text = rich_transcription_postprocess(res[0]["text"])
print(text)

运行脚本，稍等片刻，视频里的语音内容就会被精准识别并输出为文本！

识别结果示意

⚠️ 常见问题与解决方法

1. DownKyi 刷不出登录二维码

如果你使用的是 GitHub 上的 1.6.1 版本，可能会遇到无法显示二维码的问题。

解决方法：下载这个补丁文件 → DownKyi.Core.dll.zip，解压后替换软件根目录中的同名文件即可。

2. 运行脚本报错：Torch not compiled with CUDA enabled

这说明你安装的 PyTorch 不支持 GPU 加速。

解决方法：

在终端输入 nvidia-smi 查看你的显卡驱动和CUDA版本；
去 PyTorch 官网选择对应版本的安装命令，重新安装。

例如：

pip3 install torch torchaudio --index-url https://download.pytorch.org/whl/cu118

🎯 总结

通过 DownKyi + FunASR 这两款工具的搭配使用，我们实现了：

高效下载B站视频音频；
高准确率语音转写为文字；
全自动处理，无需手动干预；
支持多语言，适用性广。

无论你是做学习笔记、内容摘录，还是做自媒体字幕处理，这套方法都能帮你极大提升效率，彻底告别“手抄时代”。

如果觉得本文对你有帮助，欢迎点赞、收藏、转发！

你还用过哪些好用的AI工具？欢迎在评论区分享交流 👇

我们下期再见！

参考文章

本文章已经生成可运行项目