所用模块版本
python 3.7
fitz==0.0.1.dev2
PyMuPDF==1.22.5
功能实现
将pdf文件转换成图片url列表
def pdf_to_jpg(name, basic_url, url_dir):
"""
name: pdf文件在本地的存储路径
basic_url: 图片url列表的域名部分
url_dir: 图片的url路由部分
"""
doc = fitz.open(name)
# 将文件名同我们的保存路径拼接起来(保存图片的文件夹)
dir_name = os.path.splitext(name)[0] # 文件的全路径 创建一个文件名的文件夹
pdf_name = dir_name
# print(pdf_name)
temp = 0
os.makedirs(pdf_name, exist_ok=True)
png_path = list()
for pg in range(doc.page_count):
page = doc[pg]
temp += 1
rotate = int(0)
# 每个尺寸的缩放系数为2,这将为我们生成分辨率提高四倍的图像。
zoom_x = 2.0
zoom_y = 2.0
trans = fitz.Matrix(zoom_x, zoom_y).prerotate(rotate)
pm = page.get_pixmap(matrix=trans, alpha=False)
pic_name = '{}.png'.format(temp)
# 拼接生成pdf的文件路径
pic_pwd = os.path.join(pdf_name, pic_name)
# print(pic_pwd)
pm.save(pic_pwd)
_ = basic_url + url_dir + "/" + pic_name
png_path.append(_)
return png_path
一些函数的用法有变更。