python实现pdf到excel的自动批量转换
做的一个法拍房源地图可视化项目,获取的房源都是Pdf格式,需要转换成excel格式进行再进行处理,先把转换代码分享一下。
pdf格式如下:

转换后的excel:

备注:需要pip 安装pdfplumber库,试了其它的库还是这个最好用。
转换的完整代码如下:
import os
import pandas as pd
import sys
import importlib
import math
import csv
import pdfplumber
importlib.reload(sys)
dir = '/Users/awesomeo/map/foreclosure' #存放pdf的文件夹
def pdf_to_excel(dir):

在法拍房源地图可视化项目中,使用Python将Pdf格式的房源数据自动批量转换为Excel以便进一步处理。推荐使用pdfplumber库,这是完成转换的最佳选择。代码适合Python初学者,欢迎交流。
最低0.47元/天 解锁文章
2043





