Java 将PDF转为PDF/A

本文介绍如何使用Java程序将PDF文档转换为PDF/A格式,确保文档长期存档且内容不变。文章提供具体步骤与代码示例,包括使用Spire.Pdf.jar库的方法。

通过将PDF格式转换为PDF/A格式,可保护文档布局、格式、字体、大小等不受更改,从而实现文档安全保护的目的,同时又能保证文档可读、可访问。本篇文章,将通过Java后端程序代码展示如何将PDF转为符合PDF/A1A, 2A, 3A, 1B, 2B和3B标准的PDF。以下是具体方法及步骤。

Jar包导入

本次程序中导入的是Spire.Pdf.jar。可在Maven程序中配置pom.xml如下内容来实现下载导入:

<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <name>e-iceblue</name>
        <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.pdf</artifactId>
        <version>5.1.0</version>
    </dependency>
</dependencies>

或者,可将Jar下载到本地,解压,找到lib文件夹下的jar文件;然后在Java程序中执行如下操作手动导入:

 将PDF转为PDF/A

Spire.PDF for Java中的 PdfStandardsConverter 类下面枚举了可将PDF转为本地PDF/A文件和流文件的多种方法,如下表:

方法解释
PdfStandardsConverter.toPdfA1A(String filePath)保存为PDF/A1A到指定路径
PdfStandardsConverter.toPdfA1A(OutputStream stream)保存为PDF/A1A到流
PdfStandardsConverter.toPdfA1B (String filePath)保存为PDF/A1B到指定路径
PdfStandardsConverter.toPdfA1B(OutputStream stream)保存为PDF/A1B到流
PdfStandardsConverter.toPdfA2A(String filePath)保存为PDF/A2A到指定路径
PdfStandardsConverter.toPdfA2A(OutputStream stream)保存为PDF/A2A到流
PdfStandardsConverter.toPdfA2B(String filePath)保存为PDF/A2B到指定路径
PdfStandardsConverter.toPdfA2B(OutputStream stream)保存为PDF/A2B到流
PdfStandardsConverter.toPdfA3A(String filePath)保存为PDF/A3A到指定路径
PdfStandardsConverter.toPdfA3A(OutputStream stream)保存为PDF/A3A到流
PdfStandardsConverter.toPdfA3B(String filePath)保存为PDF/A3B到指定路径
PdfStandardsConverter.toPdfA3B(OutputStream stream)保存为PDF/A3B到流

实现格式转换时,只需要两行代码即可完成转换,得到目标PDF/A格式。以下是实现转换的代码示例步骤:

  1. 实例化PdfStandardsConverter类的对象,并加载PDF源文档。
  2. 通过调用上述表格中的指定方法将PDF转为指定标准格式的PDF/A,并保存。

Java

import com.spire.pdf.conversion.PdfStandardsConverter;

public class PDFtoPDFA {
    public static void main(String[]args){

        //创建PdfStandardsConverter类的对象,传入文档路径
        PdfStandardsConverter converter = new PdfStandardsConverter("sample.pdf");

        //转换为PdfA1A
        converter.toPdfA1A("ToPdfA1A.pdf");

        //转换为PdfA1B
        converter.toPdfA1B("ToPdfA1B.pdf");

        //转换为PdfA2A
        converter.toPdfA2A("ToPdfA2A.pdf");

        //转换为PdfA2B
        converter.toPdfA2B( "ToPdfA2B.pdf");

        //转换为PdfA3A
        converter.toPdfA3A( "ToPdfA3A.pdf");

        //转换为PdfA3B
        converter.toPdfA3B( "ToPdfA3B.pdf");
    }
}

PDF/A格式转换效果,如图:

 

—End—

Java实现PDFTXT有多种方法,以下为你介绍两种常用的方式: ### 使用itextpdf分页解析pdf文件 itextpdf是一个广泛用于处理PDF文件的Java库,可以通过它分页解析PDF文件并将内容提取到TXT文件中。以下是示例代码: ```java import com.itextpdf.text.pdf.PdfReader; import com.itextpdf.text.pdf.parser.PdfTextExtractor; import java.io.FileWriter; import java.io.IOException; public class ItextPdfToTxt { public static void main(String[] args) { try { // 输入的PDF文件路径 String pdfFilePath = "input.pdf"; // 输出的TXT文件路径 String txtFilePath = "output.txt"; PdfReader reader = new PdfReader(pdfFilePath); FileWriter writer = new FileWriter(txtFilePath); int numberOfPages = reader.getNumberOfPages(); for (int page = 1; page <= numberOfPages; page++) { String text = PdfTextExtractor.getTextFromPage(reader, page); writer.write(text); } writer.close(); reader.close(); } catch (IOException e) { e.printStackTrace(); } } } ``` ### 使用Aspose.PDF库 Aspose.PDF是一个强大而全面的Java库,用于创建、编辑和处理PDF文档,也能实现PDFTXT的功能。使用前需要添加Aspose.PDF的依赖,以下是示例代码: ```java import com.aspose.pdf.Document; import com.aspose.pdf.SaveFormat; import java.io.IOException; public class AsposePdfToTxt { public static void main(String[] args) throws IOException { // 输入的PDF文件路径 String pdfFilePath = "input.pdf"; // 输出的TXT文件路径 String txtFilePath = "output.txt"; Document pdfDocument = new Document(pdfFilePath); pdfDocument.save(txtFilePath, SaveFormat.Text); } } ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值