__author__ = 'fremcode@gmail.com'
# -*- coding: utf-8 -*-
import os
import sys
import fnmatch
import win32com.client
PATH = os.path.abspath(os.path.dirname(sys.argv[0]))
PATH_DATA = os.path.abspath(os.path.dirname(sys.argv[0]))+"\data"
#主要执行函数
def main():
wordapp = win32com.client.gencache.EnsureDispatch("Word.Application")
try:
for root, dirs,files in os.walk(PATH_DATA):
for _dir in dirs:
pass
for _file in files:
if not fnmatch.fnmatch(_file,'*.doc'):
continue
word_file = os.path.join(root, _file)
wordapp.Documents.Open(word_file)
docastxt = word_file[:-3] +'txt'
wordapp.ActiveDocument.SaveAs(docastxt,FileFormat = win32com.client.constants.wdFormatText)
wordapp.ActiveDocument.Close()
finally:
wordapp.Quit()
print "well done!"
if __name__ == '__main__':
main()word文档转换为txt-python
最新推荐文章于 2025-02-08 19:58:11 发布
本文介绍了一个使用Python脚本批量将Microsoft Word文档(.doc格式)转换为纯文本文件(.txt格式)的方法。该脚本利用win32com客户端库操作Word应用程序,实现了自动化文档转换的功能。
9408

被折叠的 条评论
为什么被折叠?



