实现目标:
使用python批量读取PDF中的表格数据并写入Excel文档
pdf路径:“D:\学习资料\Python\读取PDF\账单”
实现思路:
使用os、pdfplumber、openpyxl模块实现
os :用于获取pdf文件
pdfplumber :用于操作pdf文件
openpyxl :用于操作excel文件
实现步骤:
1、获取PDF文件列表
首先,要进行文件相关的操作,我们需要使用import导入Python内置的os模块。
接着,将路径作为参数传入os.listdir()函数,就可以获得一个列表,该列表内装有该路径下所有pdf文件名称。
# 使用import导入os模块
import os
# 将PDF文件夹路径 D:\学习资料\Python\读取PDF\账单,赋值给变量path
path = "D:\学习资料\Python\读取PDF\账单"
# 使用os.listdir()函数获取该路径下所有的文件名称,并赋值给变量allItems
allItems = os.listdir(path)
# 使用print输出文件名称
print(allItems)
2、遍历文件列表,读取PDF文档
操作