Lucene---全文检索(文档pdf/txt/office/html)

本文介绍了使用Lucene进行文档搜索的应用实践,重点讲解了如何利用PDFBox处理PDF文件及使用POI处理Office文档的方法,并分享了在实际项目中遇到的问题及解决思路。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一,最近做了一些使用lucene对文档的一些搜索

主要使用

1,PDFBOX---处理.pdf文件

2,poi--------处理office文件

 

经最近公司重新开发lucene应用,发现以下代码多处bug,,,,可查看...http://wuquanyin1011.iteye.com/admin/blogs/832694

进行相应修改

 

上传文件的jar包如下:

 

上传的源码如下上传文件中:

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值