目录
有的时候需要提取word中带自动编号的信息。对于word中的文字很多第三方的库都可以搞定,但是,提取格式,可能还是要用pywin32来搞定。
首先,需要知道自动编号的对象名称,即ListFormat。
注意区分一下ListFormat的2个属性:ListString和ListValue。看名字,感觉有点相似。
访问listformat的ListString,能获取到编号的字符串,即你看到word文档中编号的字符串,例如“1)”
而,ListValue,则读取到的是编号的值,例如文档中“5)”的编号,读取到的是5。
具体用哪个,就看个人需求。
1、读取编号
读取示例
示例文档内容,其中包含带编号的段落以及普通文本:
读取的效果:
可以看到正文行打印的结果为空字符串。
脚本:
import win32com.client as win32
from win32com