import org.apache.pdfbox.Loader;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.pdmodel.PDPageTree;
import org.apache.pdfbox.pdmodel.PDResources;
import org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject;
import org.apache.pdfbox.text.PDFTextStripper;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.*;
import java.util.Iterator;
/**
* @program: 项目名
* @description:
* @author: manhengwei
* @create: 2022-09-02 16:46
**/
public class PDFUtil {
public static void main(String[] args) throws IOException {
//提取图片
extractImages("C:\\Users\\ext.manhengwei1\\Desktop\\csdn.pdf");
//提取文字
extractText("C:\\Users\\ext.manhengwei1\\Desktop\\csdn.pdf");
}
/**
* 提取文本
* @return
*/
public static void extractText(String path){
try {
File fdf = new File(path);
//通过文件名加载文档
JAVA提取PDF图片和文字排版
最新推荐文章于 2025-09-10 18:43:47 发布
本文介绍如何利用Java编程,结合Apache库,有效地从PDF文档中提取图片和文本内容,实现PDF的排版解析。

最低0.47元/天 解锁文章
1万+





