自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 利用win32com和smb获取文件并转存

用smb 获取远程公共盘中word文件。并根据后缀doc/docx 分类保存到本地因为python docx不能直接读doc后缀的文件,利用win32com将doc文件转换成docx文件,以便用python docx 直接读取解析。最后将下载下来的中间文件删除from smb.SMBConnection import SMBConnection ## 链接公共盘服务器from win32com import client as wc #这个package 只能在windows使用impor

2022-05-30 16:33:14 1294

原创 装APScheduler 装包顺序

装APScheduler遇到一个问题就是 可以直接装上但是from apscheduler.schedulers.blocking import BlockingScheduler这句会报错ModuleNotFoundError: No module named 'apscheduler.schedulers'虽然可以importapscheduler 但是其他模块都用不了发现是自己装错版本装了个2.xx的,结果装新版就发现一堆依赖包没有装了半天终于装完了,记录一下装包过程装A.

2022-05-27 18:07:14 502

原创 docxtpl 学习笔记

之前一致用python docx 设置word 格式设置的好辛苦,弄了半夜也不知道表格允许跨页隔断和各页顶端以标题行显示应该怎么实现然后发现大家都是用docxtpl这个包直接设置模板导入使用的真的好方便啊1.直接新建一个word 文档把你想要设置的格式用wor设置好,包括页眉页脚啊,页边距啊,纸张大小啊,字体字号,颜色,加粗斜体 行高列宽啥的统统定义好,然后在表格中加入希望用python来进行填充的字段1) 这个字段只出现一次的,单个字段eg report name/batch no啥的 在它应

2021-10-12 15:36:30 1326 4

原创 利用python docx调整word页面及表格格式(包含页眉页脚设置)

1. 页面布局import docxfrom docx import Document document = docx.Document() ##页面布局为横向sections=document.sectionssection=sections[0]new_pagewidth,new_pageheight=section.page_height,section.page_width#设置三个参数section.orientation = WD_ORIENT.LANDS

2021-10-12 14:55:22 11218 5

原创 docxtpl 装包顺序

Markupsafe 2.0以上Jinja2sixPython-docx 0.8.8以上docxcomposedocxtpl

2021-10-11 14:20:14 1134

原创 python docx 提取word文档内嵌docx/doc/pdf文件附件

def extract_docx_document(document,tables,akts_df): rel_list=[] docx_id_all=[] proxy=[] for p in document.tables: proxy.append(p._element.xml) rIds=[] docx_id_all=[] num=loc_table(tables) ##获取当前所提取表格.

2021-09-23 10:26:33 2594 3

原创 python docx 利用tables读取表格存在错行

最近因为工作原因一直在使用python docx提取word中的表格及内嵌文件发现大家一般使用的提取方法都是直接用enumerate table.rows和row.cells直接读取表格的每行,每列,但是这样会导致一个问题,word中的table很多时候是手画的,或者经过多次编辑,行和列都存在对不齐的现象,如果用这种方法去提取表格则会导致串行。于是我就想到直接读取表格的xml信息,然后用xml来提取表格信息的方法##path 文件所在位置##tb_location 所要提取的表格为文档中的第

2021-09-23 09:43:37 1978 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除