
lucene源码分析
zoov
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Lucene源码分析 - CompressingStoredFieldsWriter 文档列写入
Lucene源码分析 - BKDWriter 存储kd树原创 2020-06-24 18:47:49 · 348 阅读 · 0 评论 -
Lucene源码分析 - MinShouldMatchSumScorer
本文的代码以lucene-core 6.3.0为准,包含MinShouldMatchSumScorer的iterator函数和执行原理。转载请注明出处。0 基本信息MinShouldMatchSumScorer类会遍历出所有scorers的迭代器中的docId,保证docId在所有迭代器中出现的次数至少是minShouldMatch次。lead变量是链表,存的是位置停留在docId的迭...原创 2019-03-19 00:20:05 · 557 阅读 · 2 评论 -
Lucene源码分析 - Lucene50SkipWriter 构建跳表
本文的代码以lucene-core 6.3.0为准,包含Lucene50SkipWriter的bufferSkip函数,finish函数等整个类所有代码的解析。转载请注明出处。原创 2019-03-07 22:12:29 · 781 阅读 · 0 评论 -
Lucene源码分析 - BlockTreeTermsWriter 存储词典(Term Dictionary)与索引(Term Index)
本文的代码以lucene-core 6.3.0为准,包含BlockTreeTermsWriter的bufferSkip函数,writeSkip函数等整个类所有代码的解析。转载请注明出处。0 基本信息 BlockTreeTermsWriter类将倒排索引存到磁盘,先了解下这个类的基本信息:1 源码分析 write函数将segment中的每个非IndexOptions....原创 2019-03-12 16:41:01 · 2548 阅读 · 1 评论 -
Lucene源码分析 - FST-Builder
分享一下Builder类的源码解析原创 2019-03-05 15:07:26 · 2212 阅读 · 1 评论 -
Lucene源码分析 - Lucene50PostingsFormat 倒排索引简介
本文的代码以lucene-core 6.3.0为准,倒排索引的基本信息和Lucene50PostingsFormat 等整个类所有代码的解析。转载请注明出处。 在lucene中,有相当多的时候需要存正整数的数组,当这个数组比较大的时候,就把它分一个个的block,每个block包含固定数量的整数,然后把每个block用PackedInts来压缩,为了达到压缩的效果,每个元素都存它本身...原创 2019-03-08 23:02:00 · 831 阅读 · 0 评论 -
Lucene源码分析 - Lucene50PostingsWriter 存储倒排索引
本文的代码以lucene-core 6.3.0为准,包含Lucene50PostingsWriter存储倒排索引的方式等整个类所有代码的解析。转载请注明出处。 Lucene50PostingsWriter类将倒排索引存到磁盘,先了解下这个类的基本信息:倒排表是以field为单位,也就是每个field都会写倒排表。docOut,posOut,payOut是三个文件的文件描述符。...原创 2019-03-08 12:48:24 · 923 阅读 · 0 评论 -
Lucene源码分析 - FST
lucene的FST的二进制存储和查询方式都是由FST这个类来实现。如果要读这些代码,首先需要了解这个类里面的一些基本的东西。原创 2019-03-01 19:37:12 · 4797 阅读 · 1 评论