按指定规则（自定义）拆分PDF文件

黎曼最初的梦想

已于 2024-04-02 11:15:18 修改

阅读量583

点赞数 8

CC 4.0 BY-SA版权

分类专栏： Python操作PDF文件文章标签： python pdf

于 2024-04-01 16:48:32 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_51423847/article/details/137238934

Python操作PDF文件专栏收录该内容

9 篇文章

订阅专栏

本文介绍了如何使用Python的PyPDF2库来实现PDF文件按照指定的页码范围进行拆分，用户需要提供输入的PDF文件名和拆分规则文件，如1-2try，将第1和2页分别保存为try.pdf。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

# -*- coding: utf-8 -*-

'''
创建文件夹：
1.txt:为拆分规则文件名，(在文件夹中写入1-4 try,就是把1-4截取下来放在文件夹为try.pdf的文件夹下)
m.pdf：为拆分文件名称
split.py为文件的名称
'''

导入需要使用的PyPDF2 包

from PyPDF2 import PdfReader, PdfWriter

# PDF文件分割

def split_pdf():
    try:
        read_file = input("请输入要拆分的PDF名字(例如test.pdf):")
        fp_read_file = open(read_file, 'rb')
        pdf_input = PdfReader(fp_read_file)  # 将要分割的PDF内容格式话
        page_count = len(pdf_input.pages)  # 获取PDF页数
        print("该文件共有{}页".format(page_count))  # 打印页数

        out_detail=input("请输入拆分规则文件名")

        with open(out_detail, 'r',True,'utf-8')as fp:
            txt = fp.readlines()
            for detail in txt:  # 打开分割标准文件
                pages, write_file = detail.split()  # 空格分组

                pdf_file = f'{write_file}.pdf'
                start_page, end_page = list(map(int, pages.split('-')))  # 将字符串数组转换成整形数组
                start_page -= 1
                try:
                    print(f'开始分割{start_page}页-{end_page}页，保存为{pdf_file}......')
                    pdf_output = PdfWriter()  # 实例一个 PDF文件编写器
                    for i in range(start_page, end_page):
                        pdf_output.add_page(pdf_input.pages[i])
                    with open(pdf_file, 'wb') as sub_fp:
                        pdf_output.write(sub_fp)
                    print(f'完成分割{start_page}页-{end_page}页，保存为{pdf_file}!')
                except IndexError:
                    print(f'分割页数超过了PDF的页数')

    except Exception as e:
        print(e)


if __name__ == '__main__':
    print("请在当前路径下建立一个拆分规则文本文件")
    print("例如：1-2 try，表示把第一页和第二页拆分出来，命名为try.pdf，一行写一次拆分")
    split_pdf()