目录
docx库官方使用文档地址
https://python-docx.readthedocs.io/en/latest/index.html
打开关闭文档
from docx import Document
document = Document('文件名1') #也可以为空
document.save('文件名2') #文件名1于文件名2可以相同,也可以不同
添加段落
paragraph = document.add_paragraph('Lorem ipsum dolor sit amet.')
此方法在文章末尾添加一个段落,并返回该段落,可接收返回值用于继续编辑该段落。
插入段落
prior_paragraph = paragraph.insert_paragraph_before('Lorem ipsum')
也可以在文章中间插入段落
添加标题
document.add_heading('The REAL meaning of the universe')
document.add_heading('The role of dolphins', level=2)
添加分页符
document.add_page_break()
添加表格
table = document.add_table(rows=2, cols=2)
表格有几个重要属性和方法来填充它们,可以通过行和列索引访问单元格:
cell = table.cell(0, 1)
填写单元格
cell.text = 'parrot, possibly dead'
通常一次访问一行单元格会更容易,例如从数据源填充可变长度的表时。 表的 .rows 属性提供对单个行的访问,每行都有一个 .cells 属性。 Row 和 Column 上的 .cells 属性都支持索引访问,就像一个列表:
row = table.rows[1]
row.cells[0].text = 'Foo bar to you.'
row.cells[1].text = 'And a hearty foo bar to you too sir!'
表格上的 .rows 和 .columns 集合是可迭代的,因此可以直接在 for 循环中使用它们。 与行或列上的 .cells 序列相同:
for row in table.rows:
for cell in row.cells:
print(cell.text)
表格大小
row_count = len(table.rows)
col_count = len(table.columns)
表格添加行
row = table.add_row()
合并单元格
table.cell(0,0).merge(table.cell(2,2))
例子:
# get table data -------------
items = (
(7, '1024', 'Plush kittens'),
(3, '2042', 'Furbees'),
(1, '1288', 'French Poodle Collars, Deluxe'),
)
# add table ------------------
table = document.add_table(1, 3)
# populate header row --------
heading_cells = table.rows[0].cells
heading_cells[0].text = 'Qty'
heading_cells[1].text = 'SKU'
heading_cells[2].text = 'Description'
# add a data row for each item
for item in items:
cells = table.add_row().cells
cells[0].text = str(item.qty)
cells[1].text = item.sku
cells[2].text = item.desc
表格样式
table.style = 'LightShading-Accent1'
添加图片
document.add_picture('image-filename.png')
图片大小
默认情况下,添加的图像以原始大小显示。 这通常比您想要的要大:
from docx.shared import Inches
document.add_picture('image-filename.png', width=Inches(1.0))
您可以自由指定宽度和高度,但通常您不想这样做。 如果您只指定一个,python-docx 将使用它来计算另一个的正确缩放值。 这样可以保留纵横比,并且您的图片看起来不会被拉伸。
提供 Inches 和 Cm 类让您以方便的单位指定测量值。 在内部,python-docx 使用英制公制单位,914400 到英寸。 因此,如果您忘记并只输入 width=2 之类的内容,您将得到一个非常小的图像:)。
段落样式
可以在创建段落时立即应用段落样式:
document.add_paragraph('Lorem ipsum dolor sit amet.', style='ListBullet')
这种特殊的样式使段落显示为项目符号,这是一件非常方便的事情。 您也可以在之后应用样式。 这两行相当于上面的一行:
paragraph = document.add_paragraph('Lorem ipsum dolor sit amet.')
paragraph.style = 'List Bullet'
应用粗体和斜体
为了理解粗体和斜体的工作原理,您需要对段落内部发生的事情有所了解。 可以这么理解:
1. 段落包含所有块级格式,例如缩进、行高、制表符等。
2. 在运行级别应用字符级格式,例如粗体和斜体。 段落中的所有内容都必须在一个段落中,但可以不止一个。 所以中间有一个粗体字的段落需要三遍,一个正常的,一个包含这个词的粗体,另一个是正常的后面的文本。r
.add_paragraph() 方法提供文本来添加段落时,它会被放入一次运行中。可以在段落上使用 .add_run() 方法添加更多内容:
paragraph = document.add_paragraph('Lorem ipsum ')
paragraph.add_run('dolor sit amet.')
paragraph = document.add_paragraph('Lorem ipsum ')
run = paragraph.add_run('dolor')
run.bold = True
paragraph.add_run(' sit amet.')
这会产生如下所示的文本:“Lorem ipsum dolor sat amet。” 请注意,如果您不需要其他任何东西,您可以在 .add_run() 的结果上设置粗体或斜体:
paragraph.add_run('dolor').bold = True
等于:
run = paragraph.add_run('dolor')
run.bold = True
如果您无论如何都要从运行中构建段落,没有必要为 .add_paragraph() 方法提供文本,这可以使您的代码更简单:
paragraph = document.add_paragraph()
paragraph.add_run('Lorem ipsum ')
paragraph.add_run('dolor').bold = True
paragraph.add_run(' sit amet.')
应用字符样式
除了指定一组段落级别设置的段落样式之外,Word 还具有指定一组运行级别设置的字符样式。 通常,您可以将字符样式视为指定字体,包括字体、大小、颜色、粗体、斜体等。
与段落样式一样,字符样式必须已在使用 Document() 调用打开的文档中定义。
添加新运行时可以指定字符样式:
paragraph = document.add_paragraph('Normal text, ')
paragraph.add_run('text with emphasis.', 'Emphasis')
您还可以在创建运行后将样式应用到运行。 此代码产生与上面几行相同的结果:
paragraph = document.add_paragraph('Normal text, ')
run = paragraph.add_run('text with emphasis.')
run.style = 'Emphasis'
与段落样式一样,样式名称与其在 Word UI 中显示的一样。
常见错误
import docx
报错 moduleNotFoundError:No module named 'exceptions'的解决方法
解决办法:
- 卸载 pip uninstall docx
- 安装 pip install python-docx
2600

被折叠的 条评论
为什么被折叠?



