# -*- coding: utf-8 -*-
'''
创建文件夹:
1.txt:为拆分规则文件名,(在文件夹中写入1-4 try,就是把1-4截取下来放在文件夹为try.pdf的文件夹下)
m.pdf:为拆分文件名称
split.py为文件的名称
'''
导入需要使用的PyPDF2 包
from PyPDF2 import PdfReader, PdfWriter
# PDF文件分割
def split_pdf():
try:
read_file = input("请输入要拆分的PDF名字(例如test.pdf):")
fp_read_file = open(read_file, 'rb')
pdf_input = PdfReader(fp_read_file) # 将要分割的PDF内容格式话
page_count = len(pdf_input.pages) # 获取PDF页数
print("该文件共有{}页".format(page_count)) # 打印页数
out_detail=input("请输入拆分规则文件名")
with open(out_detail, 'r',True,'utf-8')as fp:
txt = fp.readlines()
for detail in txt: # 打开分割标准文件
pages, write_file = detail.split() # 空格分组
pdf_file = f'{write_file}.pdf'
start_page, end_page = list(map(int, pages.split('-'))) # 将字符串数组转换成整形数组
start_page -= 1
try:
print(f'开始分割{start_page}页-{end_page}页,保存为{pdf_file}......')
pdf_output = PdfWriter() # 实例一个 PDF文件编写器
for i in range(start_page, end_page):
pdf_output.add_page(pdf_input.pages[i])
with open(pdf_file, 'wb') as sub_fp:
pdf_output.write(sub_fp)
print(f'完成分割{start_page}页-{end_page}页,保存为{pdf_file}!')
except IndexError:
print(f'分割页数超过了PDF的页数')
except Exception as e:
print(e)
if __name__ == '__main__':
print("请在当前路径下建立一个拆分规则文本文件")
print("例如:1-2 try,表示把第一页和第二页拆分出来,命名为try.pdf,一行写一次拆分")
split_pdf()