1、基础准备:
运行环境:win10系统、python3.7
插件:pywin32
2、world转text算法实现
算法思路:
(1)定义文件路径和转存路径:使用split切分
(2)修改新的文件名
(3)设置完整的保存路径:使用join
(4)启动应用程序进行格式转换
(5)保存文本
image.png
结构如下图所示:首先读取要提取的word文件路径,截取文件路径和文件名称,通过文件名称后缀判断是否是world文件,若是,修改文件名后缀,与前面的文件路径合并形成新的文件保存路径,然后进行文本提取,最后将提取的内容保存到新的路径下并保存。
3、工程目录如下
image.png
4、代码实现
# coding=utf-8
import fnmatch
import os
from win32com import client as wc
'''
功能描述:world文件转存txt
参数描述:1、file_path文件路径;2、save_path:保存路径