Python模块pypdftk使用教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_01068/article/details/148200518

Python模块pypdftk使用教程

pypdftk Python module to drive the awesome pdftk binary. 项目地址: https://gitcode.com/gh_mirrors/py/pypdftk

1. 项目介绍

pypdftk 是一个Python模块，用于驱动强大的pdftk二进制工具。它提供了一系列操作PDF文件的函数，包括填表、合并、拆分、加戳等。此模块由多个贡献者共同维护，并遵循MIT许可协议。

2. 项目快速启动

首先，确保你已经安装了pdftk二进制文件。pypdftk模块依赖于它来执行PDF操作。

安装pypdftk模块：

pip install pypdftk

以下是一个简单的示例，演示如何使用pypdftk来填写PDF表单：

from pypdftk import fill_form

# 填充数据
datas = {
    'firstname': '张三',
    'company': '某科技公司',
    'price': '100'
}

# 填充PDF表单并保存输出
output_pdf = fill_form('/path/to/model.pdf', datas, out_file='/path/to/output.pdf')

3. 应用案例和最佳实践

填充并 Flatten PDF表单

from pypdftk import fill_form

datas = {
    'field1': 'value1',
    'field2': 'value2'
}

pdf_path = '/path/to/form.pdf'
output_pdf = fill_form(pdf_path, datas, flatten=True)

合并多个PDF文件

from pypdftk import concat

pdf_files = ['/path/to/pdf1.pdf', '/path/to/pdf2.pdf']
output_pdf = concat(pdf_files)

拆分PDF文件

from pypdftk import split

pdf_path = '/path/to/split.pdf'
output_dir = '/path/to/output_dir'
split(pdf_path, out_dir=output_dir)

为PDF文件添加页面

from pypdftk import get_num_pages, replace_page

pdf_path = '/path/to/existing.pdf'
num_pages = get_num_pages(pdf_path)

# 假设我们要在第三页后插入新页面
page_number = 3
new_page_pdf = '/path/to/new_page.pdf'

# 创建一个新PDF，包含原始PDF的前三页，加上新页面，再加上原始PDF的剩余页面
pdf_with_new_page = replace_page(pdf_path, page_number, new_page_pdf)