JAVA解析PDF内容

不废话,很简单,超实用。表格,图片都可以解析,
1下载**Spire.Pdf.jar**,

点击此处下载jar包

2代码

public static void main(String[] args)  {
	try {
		PdfDocument doc = new PdfDocument();
		doc.loadFromFile("E:\\pdf\\test.pdf");
		StringBuilder sb = new StringBuilder();
		PdfPageBase page;
		for (int i = 0; i < doc.getPages().getCount(); i++) {
			//获取每一行的page对象
			page = doc.getPages().get(i);
			sb.append(page.extractText(true));
			//这个if中是图片的解析输出
			if (page.extractImages() != null) {
				for (BufferedImage image : page.extractImages()) {
					if (image != null) {
						//指定输出图片名,指定图片格式,后缀自己换
						File output = new File("E:\\pdf\\img.png");
						ImageIO.write(image, "PNG", output);
					}
				}
			}
		}
		System.out.println(sb);
		doc.close();
	} catch (Exception e) {
		e.printStackTrace();
	}
}

 源文件

评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值