
Lucene
快乐崇拜234
学习笔记
展开
-
lucene学习笔记(八)lucene实时搜索
在项目中需要使用lucene构建时时搜索。 在网上找了一篇论文,然后根据该文章自己实现了时时搜索功能。原文链接:有关Lucene的问题(8):用Lucene构建实时索引的文档更新问题在有关Lucene的问题(7),讨论了使用Lucene内存索引和硬盘索引构建实时索引的问题。然而有的读者提到,如果涉及到文档的删除及更新,那么如何构建实时的索引呢?本节来讨论这个问题。1、Lucene删除文档的几种方式转载 2017-01-25 14:21:35 · 1696 阅读 · 0 评论 -
lucene学习笔记(七)lucene近实时搜索
近实时搜索Lucene3.5起提供了NRTManager管理近实时搜索。原理:将搜索存放到内存中,每个一定时间提交到硬盘中。NRTManager和SearchManager是线程安全的使用NRTManager获取SearchManager。并且使用NRTManager进行修改操作。其修改操作只是保存在内存中,只有writer.commit()时才保存到硬盘中。NRTManager是每个一定时间调用一原创 2017-01-25 14:15:09 · 1955 阅读 · 0 评论 -
lucene学习笔记(五)lucene高级搜索
1、搜索排序2、搜索过滤3、自定义评分3.1、创建一个类继承于CustomScoreQuery3.2、覆盖getCustomScoreProvider方法3.3、创建CustomScoreProvider类3.4、覆盖customScore方法3.5、根据field进行评分 4、自定义QueryParser原因: 1. 对于某些QueryParser(FuzzyQuery,WildcardQue原创 2017-01-25 13:39:30 · 1467 阅读 · 0 评论 -
lucene学习笔记(四)lucene分词详解
分词器的核心类AnalyzerSimpleAnalyzerStopAnalyzerWhitespaceAnalyzerStandardAnalyzerTokenStream分词器做好处理之后得到的一个流,这个流中存储了分词的各种信息,可以通过TokenStream有效的获取到分词单元信息 在这个流中所需要存储的数据 Tokenizer主要负责接收字符流Reader,将Reader进原创 2017-01-25 13:31:30 · 4629 阅读 · 2 评论 -
lucene学习笔记(三)lucene搜索查询
1、搜索的简单实现(TermQuery)1.1、创建IndexReader1.2、创建IndexSearcher1.3、创建Term和TermQuery1.4、根据TermQuery获取TopDocstds.totalHits是总记录数,和传入的num没有任何关系1.5、根据TopDocs获取ScoreDoc1.6、根据ScoreDoc获取相应文档2、其他搜索Query2.1、TermRange原创 2017-01-25 13:23:35 · 1368 阅读 · 0 评论 -
lucene学习笔记(二)lucene建立索引
1. 基本概念Field.Store.YES或者NO(存储域选项)设置为YES表示或把这个域中的内容完全存储到文件中,方便进行文本的还原设置为NO表示把这个域的内容不存储到文件中,但是可以被索引,此时内容无法完全还原(doc.get)Field.Index(索引选项)Index.ANALYZED:进行分词和索引,适用于标题、内容等Index.NOT_ANALYZED:进行索引,但是不进行分原创 2017-01-25 13:22:03 · 1303 阅读 · 0 评论 -
lucene学习笔记(一)简介
这是3年前的学习笔记,使用的lucene3.6.1,现在将其搬到优快云博客上来。虽然版本比较老了,但是其内部实现机制变动并不是特别大。本系列教程分为一下内容:在全文索引工具中,都是由这样的三部分组成 1. 索引部分(I am a boy) 2. 分词部分 3. 搜索部分系统架构图: 关键核心类:原创 2017-01-25 12:21:15 · 1181 阅读 · 0 评论 -
lucene学习笔记(六)lucene扩展:高亮显示,luke,tika
lukeluke是一个查询索引的工具,使用时必须注意:版本要与lucene的版本完全一致,否则可能打不开索引信息 java -jar luke-xx-xx.jar可以打开索引 选择索引说存储的目录,就可以使用luke查询和操作相应的索引信息,并且可以在search中根据QueryParser来查询相应的信息tikaTika是2008年才产生的一个apache的项目,主要用于打开各种不同的文档,1原创 2017-01-25 14:04:34 · 1616 阅读 · 0 评论