PDF转图片的JAVA开源项目研究

最新推荐文章于 2024-11-14 10:54:16 发布

pthill

最新推荐文章于 2024-11-14 10:54:16 发布

阅读量303

点赞数

CC 4.0 BY-SA版权

文章标签： java

本文链接：https://blog.youkuaiyun.com/pthill/article/details/84431200

本文对比了几种PDF转图片的开源工具：PDFRenderer、pdfbox、jpedal，并介绍了ICEPDF的使用方法，解决了中文PDF转换时的字体问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

项目中要使用PDF的缩略图，使用java几个开源项目来对pdf转换为图片的工作。

参照了文章：http://javasogo.iteye.com/blog/1169234

对比这几款开源项目PDFRenderer、pdfbox、jpedal 的做法：

1.PDFRenderer：确实效率最高，但是缺少字体支持对大多数中文pdf处理不了（很奇怪为什么项目组还没做默认字体支持）

2.pdfbox：字体基本都可以转换，但容易内存溢出（我搞了几十M文件就不行了）

3.jpedal：效率不错。不过我这里好几个中文pdf文件就是生成缩略图不对，我还向项目组提bug了

没有办法，在目前我遇到字体解决不了情况，我寻找到了ICEPDF，这个项目也有商业和开源的。我用了开源的ICEPDF-4.2.2 （最新有4.3了），它其实用了jpedal的字体支持库，确能支持我手上的中文pdf，而且效率不错（测试没遇到内存溢出）。使用比较方便，这里把代码贴在这里：

public static final String FILETYPE_JPG = "jpg";
	public static final String SUFF_IMAGE = "." + FILETYPE_JPG;

/**
	 * 将指定pdf文件的首页转换为指定路径的缩略图
	 *@param filepath 原文件路径，例如d:/test.pdf
	 *@param imagepath 图片生成路径，例如 d:/test-1.jpg
	 *@param zoom     缩略图显示倍数，1表示不缩放，0.3则缩小到30%
	 */
	public static void tranfer(String filepath, String imagepath, float zoom)
			throws PDFException, PDFSecurityException, IOException {
		// ICEpdf document class
		Document document = null;

		float rotation = 0f;

		document = new Document();
		document.setFile(filepath);
		// maxPages = document.getPageTree().getNumberOfPages();

		BufferedImage img = (BufferedImage) document.getPageImage(0,
				GraphicsRenderingHints.SCREEN, Page.BOUNDARY_CROPBOX, rotation,
				zoom);

		Iterator iter = ImageIO.getImageWritersBySuffix(FILETYPE_JPG);
		ImageWriter writer = (ImageWriter) iter.next();
		File outFile = new File(imagepath);
		FileOutputStream out = new FileOutputStream(outFile);
		ImageOutputStream outImage = ImageIO.createImageOutputStream(out);
		writer.setOutput(outImage);
		writer.write(new IIOImage(img, null, null));
	}