# -*- coding: utf-8 -*-
#!/usr/bin/env python
import sys
import os
from pyPdf import PdfFileWriter, PdfFileReader
# 这里简化了,可以使用walk,搜索出某目录下的全部pdf文件,再处理
# 下面这样处理的好处是,可以按顺序读取源pdf中的页面
pdf_filePath="D:\\test\\pdf\\"
pdf_fileName=["1", "2", "3"]
output=PdfFileWriter()
outputPages=0
for filename in pdf_fileName:
# 读取源pdf文件
p=pdf_filePath+filename+".pdf"
input=PdfFileReader(file(p,"rb"))
# 如果pdf文件已经加密,必须首先解密才能使用pyPdf
if input.isEncrypted == True:
input.decrypt("map")
# 获得源pdf文件中页面总数
pageCount=input.getNumPages()
outputPages+=pageCount
print pageCount
# 分别将page添加到输出output中
for iPage in range(0,pageCount):
output.addPage(input.getPage(iPage))
print "All Pages Number:"+str(outputPages)
# 最后写pdf文件
outputStream=file("D:/test/pdf/out.pdf","wb")
output.write(outputStream)
outputStream.close()
print "finished"
python pdf 合並
最新推荐文章于 2025-12-09 23:57:29 发布
本文介绍了一个简单的Python脚本,用于合并多个PDF文件。该脚本利用PyPDF库读取指定路径下的PDF文件,并按顺序合并这些文件。此外,还介绍了如何处理加密的PDF文件。
Python3.8
Conda
Python
Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本
您可能感兴趣的与本文相关的镜像
Python3.8
Conda
Python
Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本
1116

被折叠的 条评论
为什么被折叠?



