在文档管理和自动化领域,了解PDF文档的内在属性(如页面大小、方向和旋转角度)对于确保一致的文档处理和布局保真度至关重要。这些属性在内容重用、归档以及PDF无缝集成到网络环境或其他数字工作流程中起着关键作用,因为它们直接影响文档的可读性和用户体验。通过利用Python,开发人员可以高效提取这些属性,从而方便旋转页面的自动更正等任务。
本文将展示如何使用Python代码获取PDF文档中页面的大小、方向和旋转角度。
本文使用的方法需要Spire.PDF for Python,PyPI安装命令:pip install Spire.PDF
。
使用Python获取PDF页面的大小
我们可以使用PdfPageBase.Size.Width
和PdfPageBase.Size.Height
来获取PDF页面的宽度和高度(单位为点)。然后,我们可以使用PdfUnitConvertor
类将宽度和高度转换为其他单位,如毫米。详细步骤如下:
- 导入必要的模块。
- 创建一个
PdfDocument
对象,并使用PdfDocument.LoadFromFile()
方法加载PDF文档。 - 使用
PdfDocument.Pages.get_Item()
方法获取文档中的页面。 - 通过
PdfPageBase.Size.Width
和PdfPageBase.Size.Height
属性获取页面的宽度和高度。 - 创建一个
PdfUnitConvertor
对象。 - 使用
PdfUnitConvertor.Convert()
方法将宽度和高度转换为毫米。 - 打印结果。
- 释放资源。
代码示例
from spire.pdf import *
# 创建一个 PdfDocument 实例
pdf = PdfDocument()
# 加载 PDF 文档
pdf.LoadFromFile("示例.pdf")
# 获取第一页
page = pdf.Pages.get_Item(0)
# 获取页面宽度和高度(单位为点)
width = page.Size