python拆分PDF

本文介绍了如何使用Python的pypdf2库来拆分PDF文件。首先通过Anaconda Prompt安装pypdf2,然后展示了一个简单的代码示例,包括创建文件夹和按规则拆分PDF到指定文件夹的操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

提示:遇到需要拆分的文章应该怎么办?找各大软件,并不靠谱,那个不要钱,找了半天,还是自己用python来的快。

提示:以下是本篇文章正文内容,下面案例可供参考

一、下载python包:pypdf2

打开Anaconda Prompt (spyder)输入pip install pypdf2下载即可,挺快的,可以不用镜像。(亲测)

二、代码

1.代码

代码如下(示例):

#!/usr/bin/env python
# coding=utf-8

from PyPDF2 import PdfFileReader, PdfFileWriter


# PDF文件分割
def split_pdf():
    try:
        read_file = input("请输入要拆分的PDF名字(例如test.pdf):")
        fp_read_file = open(read_file, 'rb')
        pdf_input = PdfFileReader(fp_read_file)  # 将要分割的PDF内容格式话
        page_count = pdf_input.getNumPages()  # 获取PDF页数
        print("该文件共有{}页".format(page_count))  # 打印页数

        out_detail=input("请输入拆分规则文件名")

        with open(out_detail, 'r',True,'utf-8')as fp:
            # print(fp)
            txt = fp.readlines()
            # print(txt)
            for detail in txt:  # 打开分割标准文件
                # print(type(detail))
                pages, write_file = detail.split()  # 空格分组
               #  write_file, write_ext = os.path.splitext(write_file)  # 用于返回文件名和扩展名元组
                pdf_file = f'{write_file}.pdf'
                # liststr=list(map(int, pages.split('-')))
                # print(type(liststr))
                start_page, end_page = list(map(int, pages.split('-')))  # 将字符串数组转换成整形数组
                start_page -= 1
                try:
                    print(f'开始分割{start_page}页-{end_page}页,保存为{pdf_file}......')
                    pdf_output = PdfFileWriter()  # 实例一个 PDF文件编写器
                    for i in range(start_page, end_page):
                        pdf_output.addPage(pdf_input.getPage(i))
                    with open(pdf_file, 'wb') as sub_fp:
                        pdf_output.write(sub_fp)
                    print(f'完成分割{start_page}页-{end_page}页,保存为{pdf_file}!')
                except IndexError:
                    print(f'分割页数超过了PDF的页数')
        # fp.close()
    except Exception as e:
        print(e)


if __name__ == '__main__':
    print("请在当前路径下建立一个拆分规则文本文件")
    print("例如:1-2 try,表示把第一页和第二页拆分出来,命名为try.pdf,一行写一次拆分")
    split_pdf()



2.创建文件夹

(示例):

请添加图片描述
1.txt:为拆分规则文件名,(在文件夹中写入1-4 try,就是把1-4截取下来放在文件夹为try.pdf的文件夹下)
m.pdf:为拆分文件名称
split.py为文件的名称

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

学无涯xwy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值