如题,代码其实在之前的线上培训已经讲过。现分享该代码,并在基础上再次处理
具体代码如下:
from docx import Document # 读Word的库
from openpyxl import Workbook # 写Excel的库
“““file_path : Word文本的路径
save_path : 保存Excel的路径
”””
def word_table_excel(file_path,save_path):
document = Document(file_path)
count = 0
tables = []
wb = Workbook()
ws = wb.active
total = len(document.tables) # total 得到Word找那个有几个表格
print("总共", total, "个表格等待处理...")
for index in range(0, total):
table = []
for row in document.tables[index].rows:
line = []
for grid in row.cells:
line.append(grid.text)
table.append(line)
ws.append(line)
count = count + 1
print("第", count, "个表格正在处理...剩余", total - count + 1, "个表格", "\n")
tables.append(table)
wb.save(save_path)
print(tables)
print("表格处理完成...")
!!!然而我们如果遇到的Word是不规则的,Word中的表格个数不一样,且表格数据属性的位置不一样的时候,我们就算将Word中的表格写入Excel,对后面的数据获取也

这篇博客分享了如何处理不规则Word表格,当表格数量和数据位置不一致时,通过查找唯一字段将Word表格数据写入Excel的解决方案。作者提供了一种设计思路和实现结果,有助于从Word合同中抽取特定数据(面积,单价,付款阶段)并存储到Excel不同sheet中。
最低0.47元/天 解锁文章
3330

被折叠的 条评论
为什么被折叠?



