python-docx
是一个用于创建和更新 Microsoft Word (.docx) 文件的 Python 库。要开始使用 python-docx
,首先需要安装该库,然后可以通过一些简单的示例来学习如何用它进行文本处理。
安装 python-docx
确保你的环境中已经安装了 Python 和 pip(Python 的包管理工具)。接着,在命令行中运行以下命令来安装 python-docx
:
pip install python-docx
基本使用
这里有一些基本的例子展示如何使用 python-docx
来读取、写入Word文档。
创建一个新的Word文档
from docx import Document # 创建Document对象 doc = Document() # 添加段落 doc.add_paragraph('这是我的第一个段落。') # 保存文件 doc.save('我的文档.docx')
向现有文档添加内容
from docx import Document # 打开一个已存在的文档 doc = Document('我的文档.docx') # 在文档末尾添加新段落 doc.add_paragraph('这是第二个段落。') # 保存更改 doc.save('我的文档.docx')
读取文档中的文本
from docx import Document def read(doc_name): doc = Document(doc_name) for para in doc.paragraphs: print(para.text) read('我的文档.docx')
这些例子展示了如何使用 python-docx
来完成一些基础的任务。你可以基于这些例子探索更多功能,比如样式设置、表格操作等