python读取pdf文字，操作水印，合并pdf

最新推荐文章于 2025-03-20 21:08:57 发布

m0_72398286

最新推荐文章于 2025-03-20 21:08:57 发布

阅读量685

点赞数

文章标签： pycharm python

本文链接：https://blog.youkuaiyun.com/m0_72398286/article/details/126682997

版权

这篇博客介绍了如何使用Python进行PDF处理，包括读取PDF文件中的文字内容，操作PDF水印的添加，以及如何合并多个PDF文件，适合需要对PDF进行编辑的开发者参考。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

python读取pdf文字

将PDF每一页的内容读取:extract_text()

import PyPDF2

# PyPDF2不能读取PDF中图片上的文字
# reader1 = PyPDF2.PdfReader('./PDF素材/001-Python认知.pdf')
reader1 = PyPDF2.PdfReader('./PDF素材/001-Python环境安装.pdf')
# 一页一页的读
for i in range(reader1.getNumPages()):
    # 根据下标指定页面
    page = reader1.pages[i]
    # 将PDF每一页的内容读取:extract_text()
    content = page.extract_text