Lucene
sunghosts
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Lucene-索引创建&搜索
索引其实就是目录,我们看书首先要看书的目录来了解这本书大概讲了什么。把索引创建的过程以写书来作个类比,以快速理解这个过程。1:一篇文章包含标题和内容。2:把多篇文章合在一起编纂成书。3:这样就可以制作目录 创建索引的过程如下:1:建立索引器IndexWriter2:建立文档对象Document3:建立信息字段Field(比如书的标题、内容)4:将Field添原创 2015-04-19 14:17:22 · 401 阅读 · 0 评论 -
Lucene——解析PDF,word,excel
PDF用到的java PDF类库是:PDFBox,下载后其中lib和externa文件夹下的jar文件需要引入项目解析PDF思想:1:PDDocument加载PDF文件2:PDFTextScripper提取其中文本(getText()),返回一个String2:PDFTextScripper将PDF文本写入一个输出流(write(PDDocument, Writer)),无返回原创 2015-04-25 19:50:07 · 1625 阅读 · 0 评论
分享