目录
PyPDF2库的核心概念有三个,一个是用PdfFileReader()函数读取pdf文件,一个是用getPage()函数获取一个PageObject对象以便进行单页操作,还有一个是用PdfFileWriter()函数将内容写入pdf文件。
1、基本读取操作
读取PDF文件
pdf = PyPDF2.PdfFileReader(open("01-intro.pdf",'rb'))
获取PDF信息
info = pdf.getDocumentInfo()
获取PDF页数
pages = pdf.getNumPages()
pages = pdf.numPages