Buzz项目CLI工具使用指南：音频转录与翻译命令详解

卓桢琳Blackbird

于 2025-06-02 09:18:02 发布

阅读量304

点赞数 3

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/gitblog_00047/article/details/148377995

Buzz项目CLI工具使用指南：音频转录与翻译命令详解

buzz Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper. 项目地址: https://gitcode.com/gh_mirrors/buz/buzz

概述

Buzz项目提供了一个功能强大的命令行界面(CLI)工具，用于执行音频文件的转录和翻译任务。本文将详细介绍buzz add命令的使用方法，帮助用户高效完成语音转文字工作。

核心功能

Buzz CLI工具主要支持以下两种核心任务：

转录(Transcribe)：将音频内容转换为同种语言的文本
翻译(Translate)：将音频内容翻译为另一种语言的文本

基本命令结构

buzz add命令的基本语法如下：

buzz add [选项] [文件路径或URL...]

主要选项详解

任务类型选项

-t, --task <task>
指定要执行的任务类型：

transcribe：转录（默认值）
translate：翻译

模型相关选项

-m, --model-type <model-type>
选择使用的语音识别模型类型：

whisper：原始Whisper模型
whispercpp：Whisper.cpp实现
huggingface：Hugging Face模型
fasterwhisper：优化版Whisper
openaiapi：OpenAI API

-s, --model-size <model-size>
指定模型大小（仅适用于whisper、whispercpp和fasterwhisper）：

tiny（默认）
base
small
medium
large

--hfid <id>
指定Hugging Face模型ID（仅当--model-type为huggingface时使用）

语言处理选项

-l, --language <code>
指定音频内容的语言代码（如zh表示中文，en表示英语）。如不指定，工具会自动检测语言。

-p, --prompt <prompt>
提供初始提示文本，有助于提高识别准确率。

-w, --word-timestamps
生成词级时间戳（1.2.0版本新增功能）。

输出格式选项

--srt
生成SRT字幕文件。

--vtt
生成VTT字幕文件。

--txt
生成纯文本文件。

其他实用选项

--hide-gui
隐藏主应用程序窗口（1.2.0版本新增功能）。

--openai-token <token>
设置OpenAI访问令牌（仅当使用openaiapi模型时）。

典型使用场景示例

场景1：简单转录

buzz add audio.mp3

这将使用默认设置（tiny whisper模型）将audio.mp3文件转录为文本。

场景2：高质量转录

buzz add --model-type whisper --model-size large --word-timestamps lecture.wav

使用大型whisper模型进行转录，并生成词级时间戳。

场景3：翻译任务

buzz add --task translate --language fr --model-type openaiapi french_audio.mp3

将法语音频翻译为英语（OpenAI API模型）。

场景4：批量处理与多格式输出

buzz add --srt --vtt --txt podcast_*.mp3

批量处理所有podcast_开头的MP3文件，并同时生成SRT、VTT和TXT三种格式的输出。

性能与精度权衡建议

快速测试：使用tiny模型，速度最快但精度较低
平衡选择：small或base模型，在速度和精度间取得平衡
高精度需求：使用large模型，速度最慢但精度最高

对于生产环境，建议先使用small模型进行测试，再根据结果决定是否需要更高精度的模型。

常见问题解决

语言检测不准确：明确指定-l参数设置正确语言代码
专业术语识别差：使用-p参数提供相关术语作为初始提示
处理速度慢：尝试更小的模型尺寸或使用fasterwhisper模型类型

通过掌握这些命令选项和实用技巧，用户可以充分利用Buzz项目的CLI工具高效完成各类语音转文字任务。

buzz Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper. 项目地址: https://gitcode.com/gh_mirrors/buz/buzz

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

卓桢琳Blackbird 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。