Java 将PDF转为PDF/A

通过将PDF格式转换为PDF/A格式,可保护文档布局、格式、字体、大小等不受更改,从而实现文档安全保护的目的,同时又能保证文档可读、可访问。本篇文章,将通过Java后端程序代码展示如何将PDF转为符合PDF/A1A, 2A, 3A, 1B, 2B和3B标准的PDF。以下是具体方法及步骤。

Jar包导入

本次程序中导入的是Spire.Pdf.jar。可在Maven程序中配置pom.xml如下内容来实现下载导入:

<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <name>e-iceblue</name>
        <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.pdf</artifactId>
        <version>5.1.0</version>
    </dependency>
</dependencies>

或者,可将Jar下载到本地,解压,找到lib文件夹下的jar文件;然后在Java程序中执行如下操作手动导入:

 将PDF转为PDF/A

Spire.PDF for Java中的 PdfStandardsConverter 类下面枚举了可将PDF转为本地PDF/A文件和流文件的多种方法,如下表:

方法解释
PdfStandardsConverter.toPdfA1A(String filePath)保存为PDF/A1A到指定路径
PdfStandardsConverter.toPdfA1A(OutputStream stream)保存为PDF/A1A到流
PdfStandardsConverter.toPdfA1B (String filePath)保存为PDF/A1B到指定路径
PdfStandardsConverter.toPdfA1B(OutputStream stream)保存为PDF/A1B到流
PdfStandardsConverter.toPdfA2A(String filePath)保存为PDF/A2A到指定路径
PdfStandardsConverter.toPdfA2A(OutputStream stream)保存为PDF/A2A到流
PdfStandardsConverter.toPdfA2B(String filePath)保存为PDF/A2B到指定路径
PdfStandardsConverter.toPdfA2B(OutputStream stream)保存为PDF/A2B到流
PdfStandardsConverter.toPdfA3A(String filePath)保存为PDF/A3A到指定路径
PdfStandardsConverter.toPdfA3A(OutputStream stream)保存为PDF/A3A到流
PdfStandardsConverter.toPdfA3B(String filePath)保存为PDF/A3B到指定路径
PdfStandardsConverter.toPdfA3B(OutputStream stream)保存为PDF/A3B到流

实现格式转换时,只需要两行代码即可完成转换,得到目标PDF/A格式。以下是实现转换的代码示例步骤:

  1. 实例化PdfStandardsConverter类的对象,并加载PDF源文档。
  2. 通过调用上述表格中的指定方法将PDF转为指定标准格式的PDF/A,并保存。

Java

import com.spire.pdf.conversion.PdfStandardsConverter;

public class PDFtoPDFA {
    public static void main(String[]args){

        //创建PdfStandardsConverter类的对象,传入文档路径
        PdfStandardsConverter converter = new PdfStandardsConverter("sample.pdf");

        //转换为PdfA1A
        converter.toPdfA1A("ToPdfA1A.pdf");

        //转换为PdfA1B
        converter.toPdfA1B("ToPdfA1B.pdf");

        //转换为PdfA2A
        converter.toPdfA2A("ToPdfA2A.pdf");

        //转换为PdfA2B
        converter.toPdfA2B( "ToPdfA2B.pdf");

        //转换为PdfA3A
        converter.toPdfA3A( "ToPdfA3A.pdf");

        //转换为PdfA3B
        converter.toPdfA3B( "ToPdfA3B.pdf");
    }
}

PDF/A格式转换效果,如图:

 

—End—

### 使用 JavaPDFBox 库将 HTML 转换为 PDF PDFBox 是 Apache 提供的一个开源库,用于创建、操作和处理 PDF 文件。然而需要注意的是,PDFBox 并不直接支持将 HTML 转换为 PDF 功能[^3]。为了实现这一目标,通常会结合其他工具或库来完成此过程。 以下是通过 **Flying Saucer** 和 **iText** 这样的第三方库间接利用 PDFBox 来生成 PDF 的方法之一: #### 方法概述 由于 PDFBox 不具备原生解析 HTML 的能力,因此可以先使用 Flying Saucer 将 HTML 渲染成 XML 或者直接渲染到 PDF 中,然后再借助 PDFBox 对生成的文件进一步编辑或者保存。 下面是一个完整的例子展示如何结合外部依赖项(如 iText 或 Flying Saucer)以及 PDFBox 完成本任务。 --- #### 实现代码示例 ```java import org.xhtmlrenderer.pdf.ITextRenderer; import com.itextpdf.text.DocumentException; import java.io.*; import java.net.URL; public class HtmlToPdfConverter { public static void main(String[] args) { try { String inputFile = "example.html"; // 输入的HTML文件路径 String url = new File(inputFile).toURI().toURL().toString(); // 获取HTML URL地址 String outputFile = "output.pdf"; // 输出的PDF文件名 OutputStream os = new FileOutputStream(outputFile); ITextRenderer renderer = new ITextRenderer(); renderer.setDocument(new URL(url)); // 加载HTML文档 renderer.layout(); // 布局设置 renderer.createPDF(os); // 创建PDF并写入输出流 os.close(); // 关闭输出流 System.out.println("PDF 已成功生成!"); } catch (IOException | DocumentException e) { e.printStackTrace(); } } } ``` 上述代码片段展示了如何使用 `org.xhtmlrenderer` (即 Flying Saucer)将 HTML 文档转换为 PDF,并将其存储在一个指定位置上。这里并未涉及 PDFBox 的具体调用,因为实际过程中我们更多时候只需要它作为辅助功能的一部分参与进来即可[^4]。 如果确实希望最终产物能够被 PDFBox 所管理,则可以在后续阶段加载由该方式产生的 PDF 数据再做额外修改。 --- #### 注意事项 - 需要引入额外的支持库才能顺利完成整个流程。 - 上述方案中的核心部分依赖于 `Flying Saucer`, 如果项目环境不允许新增过多外部组件的话可能需要寻找替代品比如 wkhtmltopdf 等命令行工具配合执行脚本达成目的[^5]. ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值