犀牛派A1上使用Faster Whisper完成音频转文字

最新推荐文章于 2025-12-07 21:19:21 发布

原创

最新推荐文章于 2025-12-07 21:19:21 发布 · 602 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#whisper #音视频 #人工智能 #语言模型

项目介绍：Faster Whisper 是一个基于 CTranslate2 的 OpenAI Whisper 模型的高效实现。它是一个快速推理引擎，用于 Transformer 模型，相比 OpenAI 的 Whisper 模型，速度提升了 4 倍。该项目支持 Windows、Linux 和 macOS 平台，并且提供了多种优化选项，如 FP16 和 INT8 计算类型，以适应不同的硬件环境。

硬件：犀牛派A1
平台：QCS6490

一、环境准备

打开终端，在命令行界面中输入如下命令来安装Faster Whisper

sudo apt update && sudo apt install -y python3-pip ffmpeg
#因为这里使用CPU进行推理，安装 CPU 优化的 CTranslate2 和 Faster-Whisper
pip install faster-whisper
pip install ctranslate2 --no-deps # 确保不安装 GPU 相关依赖 
pip install faster-whisper

二、准备推理脚本

编写或拉取一个脚本，可命名为 test.py

from faster_whisper import WhisperModel
import sys
import time
def main():
    # 获取音频文件名
    if len(sys.argv) > 1:
        filename = sys.argv[1]
    else:
        filename