python 视频提取字幕

本文介绍了如何使用ffmpeg从视频中提取字幕并将其保存为SRT格式,以及如何结合OpenCV和TesseractOCR技术逐帧识别视频中的文本生成字幕。
该文章已生成可运行项目,

目录

ffmpeg提取字幕 没测试成功

opencv 加ocr


ffmpeg提取字幕 没测试成功
 

ffmpeg -i input_video.mp4 -map 0:s:0 output_subtitle.srt 

import subprocess

from moviepy.editor import VideoFileClip

video = VideoFileClip('video_o.mp4')


# subprocess.run(['ffmpeg', '-i', 'video_o.mp4', '-map', '0', '-c:s', 'srt','subtitles.srt'])

subprocess.run(['ffmpeg', '-i', 'video_o.mp4', '-map', '0:s:0','subtitles.srt'])

opencv 加ocr

import cv2
import pytesseract

# 加载视频
video_path = 'path/to/video.mp4'
video = cv2.VideoCapture(video_path)

# 设置字幕文件保存路径
output_file = 'path/to/subtitles.srt'
subtitles = []

# 逐帧处理视频
while True:
    ret, frame = video.read()
    if not ret:
        break
    
    # 将帧转换为灰度图像
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    
    # 使用Tesseract提取文本
    text = pytesseract.image_to_string(gray)
    
    # 获取当前帧的时间戳
    timestamp = video.get(cv2.CAP_PROP_POS_MSEC)
    
    # 将文本和时间戳添加到字幕列表中
    subtitles.append((timestamp, text))

# 关闭视频流
video.release()

# 将字幕保存为SRT文件
with open(output_file, 'w') as f:
    for i, (timestamp, text) in enumerate(subtitles):
        start_time = int(timestamp)
        end_time = int(timestamp) + 1000  # 假设每帧持续1秒钟
        f.write(f'{i+1}\n')
        f.write(f'{start_time} --> {end_time}\n')
        f.write(f'{text}\n\n')


https://blog.51cto.com/u_16213402/7617702

本文章已经生成可运行项目
Python可以使用一些库来提取视频字幕,以下是其中的一些方法: 1. 使用pydub库来提取音频文件,再使用SpeechRecognition库来识别并转换为文字。这个方法需要一个视频文件和其支持的音频格式。 ```python from pydub import AudioSegment import speech_recognition as sr video_path = 'path/to/video.mp4' audio = AudioSegment.from_file(video_path, format='mp4') audio.export("audio.wav", format="wav") r = sr.Recognizer() audio_file = sr.AudioFile('audio.wav') with audio_file as source: audio = r.record(source) text = r.recognize_google(audio, language='en-US') print(text) ``` 2. 使用pip install SpeechRecognition 和pip install moviepy 安装所需的一个库和Python package。该方法也是从视频提取音频,然后使用moviepy获取其视频字幕。需要提供视频文件并安装所需的库。 ```python import speech_recognition as sr from moviepy.video.io.VideoFileClip import VideoFileClip r = sr.Recognizer() video_path = 'path/to/video.mp4' clip = VideoFileClip(video_path) # 提取音频 clip.audio.write_audiofile('audio.wav') sound = AudioSegment.from_file('audio.wav', format='wav') # 获取字幕 def transcribe_audio(sound): transcript = '' with sr.AudioFile(sound) as source: audio_text = r.record(source) try: transcript = r.recognize_google(audio_text) except sr.UnknownValueError as e: print(e) return transcript transcription = transcribe_audio('audio.wav') print(transcription) ``` 3. 使用OpenCV库来提取字幕。Opencv库是一款面向计算机视觉的开源计算机视觉库。在这里它被用来获取视频字幕,并使用tesseract进行OCR处理。 ```python import cv2 import pytesseract video_path = 'path/to/video.mp4' vidcap = cv2.VideoCapture(video_path) frames = [] success, image = vidcap.read() count = 0 success = True while success: frames.append(image) success, image = vidcap.read() count += 1 for frame in frames: text = pytesseract.image_to_string(frame, lang='eng') print(text) ``` 这里只提供了一些用Python提取视频字幕的方法,您可以根据您自己的需求,选择其中的某一种方法来完成相应的任务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI算法网奇

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值