python-批量提取srt文件中的纯文本

该程序使用Python的tkinter库创建图形界面,让用户选择多个SRT字幕文件,然后批量提取其中的纯文本。程序支持utf-8、utf-16和gbk三种编码,对其他编码的文件会提示错误。处理后的文本会被保存为TXT文件,与原始SRT文件同目录。程序还包括一个进度窗口,显示文件处理状态。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

python-批量提取srt文件中的纯文本

1.功能介绍

为了方便日常的使用,我将批量提取 srt 文件中纯文本的程序打包成了 exe 文件,这样就不用安装 python 环境和相关的库了。
现在版本的程序可以选择指定路径下的多个 srt 文件,批量提取里面的文本内容。
输出的 txt 文件和原来的 srt 文件在同一目录下。

值得一提的是,由于 srt 文件存在不同的编码方式。现在版本的程序兼容了utf-8utf-16gbk 三种编码,其他的编码格式未加入编码列表中,会提示编码错误,而不进行任何操作。不影响编码正确的文件的文字提取。

2.可执行程序

如果需要可执行程序,可以下载文件:批量提取srt文件中的纯文本

3.python源代码

下面是所以的源代码:

import tkinter as tk
from tkinter import filedialog
import os

root = tk.Tk()  # 创建程序主窗口
root.withdraw()  # 隐藏该窗口

file_types = [('Text Files', '*.srt')]  # 指定要筛选的文件格式
files = filedialog.askopenfilenames(filetypes=file_types)  # 弹出文件选择对话框

progress_window = tk.Toplevel(root)  # 创建新的顶层窗口对象,作为 root 窗口的子窗口
progress_window.title("文件提取进度")
progress_window.grab_set()  # 设置为模态窗口,阻止用户操作其他窗口


def center_window(window):
    window_width = 600  # 设置弹窗的宽度
    window_height = 400  # 设置弹窗的高度
    screen_width = window.winfo_screenwidth()  # 获取屏幕宽度
    screen_height = window.winfo_screenheight()  # 获取屏幕高度
    x = (screen_width - window_width) // 2  # 计算窗口的水平位置
    y = (screen_height - window_height) // 2  # 计算窗口的垂直位置
    window.geometry(f"{
     window_width}x{
     window_height}+{
     x}+{
     y}")  # 设置窗口位置和大小


center_window(progress_window)  # 将窗口置于屏幕中央

file_list_label = tk.Label(progress_window, text="已处理的文件:", font=("TkDefaultFont", 13, "bold"))
file_list_label.pack()

file_list_text = tk.Text(progress_window, height=20, width=60, font=("TkDefaultFont", 13))
file_list_text.tag_config
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值