java获取pdf或word内容_java 读取pdf、word、Excel文件

该Java类提供了一套方法,用于读取PDF、Word文档和Excel表格的内容。通过使用itextpdf和poi库,实现了从这些文件中提取文本的函数,包括getPdfFileText、getTextFromWord和getTextFromExcel。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用到的jar:

itextpdf-5.5.8.jar   (PDF)

poi.jar

public class FileUtils {

/**

* 判断文件是否存在

*

* @Title: isExcite

* @param @param filePath

* @param @return

* @return boolean 返回类型

* @throws

*/

public static boolean isExcite(String filePath) {

File file = new File(filePath);

// 如果文件夹不存在则创建

if (!file.exists() && !file.isDirectory()) {

return false;

} else {

return true;

}

}

/**

*

* @Title: getPdfFileText

* @Description: 获取指定位置pdf的文件内容

* @param @param fileName

* @param @return

* @param @throws IOException

* @return String 返回类型

* @throws

*/

public static String getPdfFileText(String fileName) throws IOException {

PdfReader reader = new PdfRe

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值