将word、pdf、excel上的表格搬运至mysql数据库中

问题描述:有一批pdf和word文件,想把里面所有的表格取出放置在excel中,并最终将这些表格放置在mysql数据库中。

刚开始的时候,就是纯手动操作,实在让人太难受了,首先把PDF文件在word中打开,然后手动复制表格到excel中,原表格中存在多级标题栏,因为要入库,所以还要把标题栏修改成一栏,至于上传到数据库,就更麻烦了,刚开始使用导入向导,效率相当低下,后来实在太慢无趣就想到编程解决问题。

首先是将word里的表格提取至excel(PDF可以转化为docx),这里使用python,本来在网上查到的资料大部分是VB的,结果我发现使用python更加简单,又感叹了一声万能的python。使用python 安装docxopenpyxl两个库,一个操作word文档,一个操作excel,都非常简单易用,直接上代码吧。

import docx
import openpyxl

name = 'xxx'
doc = docx.Document(name + ".docx") #打开word文档
wb = openpyxl.Workbook() #新建一个excel工作簿(注意区分工作簿和工作表)
for index, table in enumerate(doc.tables, start =1):
	ws = wb.create_sheet('sheet{}'.format(index)) #对每一个表格新建一个工作表
	for row in table.rows:
		values = l
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值