应用场景:我们学校搞综测会发放一个压缩包,里面含有各种活动的加分证明,想要快速且不遗漏的找到自己的名字的话,就可以来跑一下这个py啦!
环境:jupyter
要求:事先安装 pip install python-docx
代码修改处:文件存放根目录和要搜索的关键词
#coding=utf-8
from docx import Document
import os,sys
def search_word(filename,word):
#打开文档
document = Document(filename)
#读取每段资料
pa=document.paragraphs
#拼接每一段的内容
para_list = []
for para in pa:
para_list.append(para.text)
#合并字符串
file_text = ''.join(para_list)
if word in file_text:
print("find file for {}:".format(word))
print(filename)
process_list=[]
def get_process_files(root_dir):
"""process all files in directory"""
cur_dir=os.path.abspath(root_dir)
file_list=os.listdir(cur_dir)
for file in file_list:
fullfile=cur_dir+"\\"+file
if os.path.isfile(fullfile):

本文介绍如何使用Python在文件夹中查找包含特定关键字的Word文档,适用于快速查找压缩包内的个人相关文件。代码基于jupyter环境,需要安装python-docx库,用户需修改文件根目录和搜索关键词。
最低0.47元/天 解锁文章
1249

被折叠的 条评论
为什么被折叠?



