【github 有趣项目】语音识别 Buzz 本地计算机上离线转录和翻译音频文件应用

部署运行你感兴趣的模型镜像

Buzz

  • Buzz 是一个开源的桌面应用程序(使用python开发,依赖PyQt6 、openai-whisper、pyinstaller 、torch、whisper.cpp、ffmpeg、ffprobe等库),旨在在本地计算机上离线转录和翻译音频文件,支持 macOS、Windows 和 Linux 系统。该项目由 Chidi Williams 开发,利用 OpenAI 的 Whisper 模型进行语音识别和翻译。

  • 优点:支持多种Hugging Face、OpenAI等多个whisper库,支持默认导出文件名偏好设置,支持GPU推理等

  • 缺点:Windows系统上安装包1.5G,安装完成需要5.03G空间(不包含模型参数文件)。如不经常使用,推荐网页端侧离线推理的 whisper-web(https://huggingface.co/spaces/Xenova/whisper-web),模型参数数据也会保留在电脑本地,每次运行无需重新下载,但当前的whisper-web仅支持tiny和base模型。

特性:

  • 离线转录与翻译
  • 多语言支持
  • 跨平台兼容
  • CUDA GPU 加速支持

安装

Windows

  • 下载安装程序:访问 GitHub Releases 页面 下载最新的 .exe 安装文件。

  • 通过 Winget 安装

    winget install ChidiWilliams.Buzz
    

其他系统

macOS
  • 通过 Homebrew 安装

    brew install --cask buzz
    
  • 从 App Store 下载:适用于 Apple Silicon 的用户可从 App Store 获取原生版本,提供更好的性能和用户体验。([chidiwilliams.github.io][5])

Linux
  • 通过 Snap 安装

    snap install buzz
    
  • 从源代码安装:高级用户可克隆 GitHub 仓库 并按照文档进行构建和安装。

使用

安装

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

使用

在这里插入图片描述

  • 双击查看结果和导出文件

在这里插入图片描述

您可能感兴趣的与本文相关的镜像

Python3.10

Python3.10

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值