Word文档转换图片,PDF工具
概述
本工具包提供了一系列功能用于处理Word文档(.doc和.docx格式),包括将Word文档转换为图片、将Word文档转换为PDF以及从Word文档中提取图片。此工具适用于需要将Word文档内容快速转换为其他格式的应用场景。
功能主要依赖于第三方工具封装实现,目的只为实现其功能未对代码进行优化,如需更高性能请根据自有需求进行优化改动。
主要功能
1. Word文档转图片
功能描述
- 能够检测Word文档是否主要由图片构成,并直接将这些图片提取出来。
- 对于含有文本或表格的Word文档,先将其转换为PDF,再从PDF中提取图片。
参数
inputFilePath
: Word文档的完整路径。outputFolderPath
: 输出图片的存储路径。
返回值
List<String>
: 包含所有生成图片的相对路径列表。
2. Word文档转PDF
功能描述
- 将Word文档(.docx)转换为PDF格式。
参数
inputFilePath
: Word文档的完整路径。outPDFFilePath
: PDF输出文件的完整路径。
返回值
List<String>
: 转换后PDF文件的页面图像的相对路径列表。
3. PDF转图片
功能描述
- 将PDF文件的每一页转换为一张图片。
参数
filepath
: PDF文件的完整路径。imagepath
: 图片输出路径。zoom
: 图片缩放比例。
返回值
List<String>
: 包含所有生成图片的相对路径列表。
4. 从Word文档提取图片
功能描述
- 直接从Word文档中提取图片数据并保存为独立文件。
参数
inputFilePath
: Word文档的完整路径。outputFolderPath
: 图片输出路径。
返回值
List<String>
: 包含所有提取图片的相对路径列表。
使用示例
示例1:将Word文档转换为图片
Java
1List<String> images = WordGetImgUtil.wordTurnPicture("C:/Documents/MyReport.docx");
2for (String imgPath : images) {
3 System.out.println("Generated image at: " + imgPath);
4}
示例2:将Word文档转换为PDF然后转为图片
Java
1List<String> images = WordGetImgUtil.wordTurnPdf("C:/Documents/MyReport.docx", "C:/temp/report.pdf", "C:/images");
2for (String imgPath : images) {
3 System.out.println("Generated image at: " + imgPath);
4}
示例3:从Word文档中提取图片
Java
1List<String> images = WordGetImgUtil.getImg("C:/Documents/MyReport.docx", "C:/images");
2for (String imgPath : images) {
3 System.out.println("Extracted image at: " + imgPath);
4}
注意事项
- 在进行转换操作前,请确保输入文件路径正确且文件可读。
- 输出路径必须存在且可写。
- 图片数量可能受到限制,最多处理10张图片。
以上文档基于WordGetImgUtil
类的实现,提供了将Word文档转换为图片、PDF,以及从Word文档中直接提取图片的能力。