1简介
本篇继续介绍利用Pdf2pdf库来操作PDF文件的相关内容。主要介绍写新文件,分割,合并pdf文件的实现。
pdf文件的读取,传送门:
Python3-提取pdf文件内容的方式,PyPDF2的使用
2 写入PDF文件:
pdf文件不能像普通的文本文件,直接进行写入。而是通过其它pdf文件获取到pdf页面,再将这个页面内容写入新的pdf文件中。每一个pdf文件都包含若干个page(页面)。
常用的Class有:
PdfFileReader :用于读取pdf文件;
PdfFileMerger :用于合并pdf文件;
PageObject :pdf页面对象;
PdfFileWriter 用于写入pdf文件。
举例:将一个pdf文件的第一页写入到一个新的pdf文件中。
代码如下:
# -*- coding: utf-8 -*-
import PyPDF2
from PyPDF2 import PdfFileReader
from PyPDF2 import PdfFileWriter
import chardet
from chardet import detect as char_detect
# 写文件
def write_pdf():
oldFileName = 'Effective C++ 英文版.pdf'
newfileName = "Effective C++ 英文版_二页.pdf"
pageObj = read_one_page(oldFileName);
# 获取一个 PdfFileWriter 对象

最低0.47元/天 解锁文章
4850

被折叠的 条评论
为什么被折叠?



