【python-api】python 操作word文件参考一则

原创于 2021-09-09 16:48:16 发布 · 204 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

python模块专栏收录该内容

8 篇文章

订阅专栏

分享一个用于从Word文档中批量抓取以'ST-F-'开头测试用例的Python2脚本，解决了中文显示问题，适用于QA测试用例管理

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

脚本开发背景：

在项目开发过QA验收的过程中，涉及到开发测试用例的工作。测试用例的文档中有一些固定格式的条目，这些条目在后续的功能演示中需要逐一解决验证情况，所以需要把这些用例提取出来。所以，花5分钟开发了一个提取word中所有以“ST-F-”开头条目的小脚本，过程中解决的主要问题是中文显示的问题。有类似功能的需要开发的可以参考一下：

#coding=utf-8
import os
from docx import Document
file_list = os.listdir('.')
tag_file = ''
for file in file_list:
    if file.endswith(".doc") or file.endswith(".docx"):
        tag_file = file
if not tag_file:
    exit()
#tag_file = os.path.abspath(tag_file)
print(tag_file)
f = open(tag_file, 'rb')
document = Document(f)
l = [ paragraph.text.encode('raw_unicode_escape') for paragraph in document.paragraphs]
if "tmp.json" in file_list:
    os.remove("tmp.json")
with open("tmp.json", "w") as base_info:
    for i in l:
        if str(i.decode('unicode_escape')).startswith("ST-F-"):
            base_info.write(str(i.decode('unicode_escape'))+"\n")

这个脚本基于python2开发，py3跑不通的可以评论区告诉我

博客等级

码龄8年

47
原创

20
点赞

25
收藏

31
粉丝

关注

私信

热门文章

分类专栏

JAVA 1篇
PYTHON 1篇
GOLANG 1篇
csapp 1篇
工具 14篇
深入JavaScript 2篇
jvm 2篇
spring 1篇
面试 4篇
struts2 1篇
从jdk看java 2篇
hibernate 1篇
并发编程实战 2篇
算法 3篇
python模块 8篇
经验总结 10篇

展开全部收起

上一篇：: 【tool合集-samba】centos7安装samba-linux文件映射win

下一篇：: 同时用python java go快速刷完了《剑指offer》--谈谈感受

最新评论

【celery】常用记录
北风之神c: 写得赞，博主用心了，但主要还是celery太难了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字，所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图，因为与一下6点关系很大。 1) 整个项目目录结构,celery的目录结构和任务函数位置，有很大影响 2) @task入参 ,用户有没有主动设置装饰器的入参 name,设置了和没设置有很大不同，建议主动设置这个名字对函数名字和所处位置依赖减小 3) celery的配置，task_queues(在3.xx叫 CELERY_QUEUES )和task_routes (在3.xx叫 task_routes) 4) celery的配置 include （在3.xx叫 CELERY_INCLUDE）或者 imports (3.xx CELERY_IMPORTS) 或者 app.autodiscover_tasks的入参 5) cmd命令行启动参数 --queues= 的值 6) 用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 https://function-scheduling-distributed-framework.readthedocs.io/zh_CN/latest/index.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等19个方面全方位超过celery，任何方面都是有过之而无不及。
【tool合集-samba】centos7安装samba-linux文件映射win
alex_i: 写的真棒
git 多项目操作脚本
alex_i: NewName = os.path.join(path, new_name) OldName = os.path.join(path, file) os.rename(OldName, NewName) [/code][code=python] [/code]
pip 离线安装流程
alex_i: https://download.youkuaiyun.com/download/buxizhizhoum/10802442?utm_source=bbsseo

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。