语言:python 3
用法:选择PDF文件所在的目录,点击 确定 后,自动将该目录下的所有PDF转换成单个图片,图片名称为: pdf文件名.page_序号.jpg
如运行中报错,需要自行根据报错内容按照缺失的库
例如:
#安装库
pip install pyautogui
#安装库
pip install pillow
这里提供两种源码,第一种是在代码中手动添加pdf所在目录
import os
import glob
from PyPDF2 import PdfReader
from pdf2image import convert_from_path
pdf_dir = "path/to/pdf_dir/" #pdf目录
# 遍历目录中的PDF文件
pdf_files = glob.glob(os.path.join(pdf_dir, "*.pdf"))
# 遍历每个PDF文件,并将其转换为图片
for pdf_file in pdf_files:
# 创建PdfReader对象
pdf = open(pdf_file, 'rb')
pdf_reader = PdfReader(pdf)
# 遍历PDF的页面并将其转换为图片
for page_num in range(len(pdf_reader.pages)):
# 获取页面对象
page = pdf_reader.pages[page_num]
# 将PDF页面转换为图像
images = convert_from_path(pdf_file, first_page=page_num+1, last_page=

本文介绍了使用Python3(PyPDF2和pdf2image库)实现的自动化脚本,可以自动选择或指定PDF目录,将其中的所有PDF文件逐页转换为JPG图片,包括手动选择文件夹和在代码中指定目录两种方法。
最低0.47元/天 解锁文章
5160

被折叠的 条评论
为什么被折叠?



