如何使用python通过代码生成视频的字幕文件

最新推荐文章于 2025-04-08 10:21:57 发布

优课汇阿优

最新推荐文章于 2025-04-08 10:21:57 发布

阅读量541

点赞数 4

文章标签： python 音视频开发语言

本文链接：https://blog.youkuaiyun.com/cookietian/article/details/145415933

版权

要使用 Python 生成视频的字幕文件，可以结合 ffmpeg 和 whisper（一个强大的语音识别模型）来实现。以下是一个完整的步骤指南，包括代码示例：

1. 安装必要的工具和库

首先，确保安装了以下工具和库：

FFmpeg：用于视频处理，可以从 FFmpeg 官网下载。
Python：确保你的电脑上安装了 Python。
whisper：一个基于 OpenAI 的语音识别库。
ffmpeg-python：用于在 Python 中调用 FFmpeg。

安装命令如下：

bash复制

pip install ffmpeg-python
pip install git+https://github.com/openai/whisper.git

2. 提取视频音频

使用 ffmpeg 从视频中提取音频：

bash复制

ffmpeg -i input.mp4 -vn -acodec copy output.aac

3. 使用 Whisper 生成字幕

创建一个 Python 脚本来调用 Whisper 模型，生成字幕文件：

Python复制

import whisper
from whisper.utils import get_writer

# 加载 Whisper 模型
model = whisper.load_model("base")  # 可选模型：tiny, base, small, medium, large

# 转录音频文件
result = model.transcribe("output.aac", language="zh", verbose=True)

# 保存字幕文件
writer = get_writer("srt", ".")
writer(result, "output.srt")

4. 将字幕添加到视频

使用 ffmpeg 将生成的字幕文件添加到视频中：

bash复制

ffmpeg -i input.mp4 -i output.srt -c:v copy -c:a copy -c:s mov_text output_with_subtitles.mp4

完整代码示例

将上述步骤整合到一个 Python 脚本中：

Python复制

import whisper
from whisper.utils import get_writer
import subprocess

def extract_audio(video_path, audio_path):
    """从视频中提取音频"""
    subprocess.run([
        "ffmpeg", "-i", video_path, "-vn", "-acodec", "copy", audio_path
    ])

def transcribe_audio(audio_path, subtitle_path):
    """使用 Whisper 转录音频并生成字幕文件"""
    model = whisper.load_model("base")
    result = model.transcribe(audio_path, language="zh", verbose=True)
    writer = get_writer("srt", ".")
    writer(result, subtitle_path)

def add_subtitles_to_video(video_path, subtitle_path, output_path):
    """将字幕添加到视频中"""
    subprocess.run([
        "ffmpeg", "-i", video_path, "-i", subtitle_path, "-c:v", "copy", "-c:a", "copy", "-c:s", "mov_text", output_path
    ])

# 示例调用
video_path = "input.mp4"
audio_path = "output.aac"
subtitle_path = "output.srt"
output_path = "output_with_subtitles.mp4"

extract_audio(video_path, audio_path)
transcribe_audio(audio_path, subtitle_path)
add_subtitles_to_video(video_path, subtitle_path, output_path)