
lucene源码分析
zoov
这个作者很懒,什么都没留下…
展开
-
Lucene源码分析 - CompressingStoredFieldsWriter 文档列写入
Lucene源码分析 - BKDWriter 存储kd树原创 2020-06-24 18:47:49 · 326 阅读 · 0 评论 -
Lucene源码分析 - MinShouldMatchSumScorer
本文的代码以lucene-core 6.3.0为准,包含MinShouldMatchSumScorer的iterator函数和执行原理。转载请注明出处。 0 基本信息 MinShouldMatchSumScorer类会遍历出所有scorers的迭代器中的docId,保证docId在所有迭代器中出现的次数至少是minShouldMatch次。 lead变量是链表,存的是位置停留在docId的迭...原创 2019-03-19 00:20:05 · 540 阅读 · 2 评论 -
Lucene源码分析 - Lucene50SkipWriter 构建跳表
本文的代码以lucene-core 6.3.0为准,包含Lucene50SkipWriter的bufferSkip函数,finish函数等整个类所有代码的解析。转载请注明出处。原创 2019-03-07 22:12:29 · 765 阅读 · 0 评论 -
Lucene源码分析 - BlockTreeTermsWriter 存储词典(Term Dictionary)与索引(Term Index)
本文的代码以lucene-core 6.3.0为准,包含BlockTreeTermsWriter的bufferSkip函数,writeSkip函数等整个类所有代码的解析。转载请注明出处。 0 基本信息 BlockTreeTermsWriter类将倒排索引存到磁盘,先了解下这个类的基本信息: 1 源码分析 write函数将segment中的每个非IndexOptions....原创 2019-03-12 16:41:01 · 2524 阅读 · 1 评论 -
Lucene源码分析 - FST-Builder
分享一下Builder类的源码解析原创 2019-03-05 15:07:26 · 2179 阅读 · 1 评论 -
Lucene源码分析 - Lucene50PostingsFormat 倒排索引简介
本文的代码以lucene-core 6.3.0为准,倒排索引的基本信息和Lucene50PostingsFormat 等整个类所有代码的解析。转载请注明出处。 在lucene中,有相当多的时候需要存正整数的数组,当这个数组比较大的时候,就把它分一个个的block,每个block包含固定数量的整数,然后把每个block用PackedInts来压缩,为了达到压缩的效果,每个元素都存它本身...原创 2019-03-08 23:02:00 · 806 阅读 · 0 评论 -
Lucene源码分析 - Lucene50PostingsWriter 存储倒排索引
本文的代码以lucene-core 6.3.0为准,包含Lucene50PostingsWriter存储倒排索引的方式等整个类所有代码的解析。转载请注明出处。 Lucene50PostingsWriter类将倒排索引存到磁盘,先了解下这个类的基本信息: 倒排表是以field为单位,也就是每个field都会写倒排表。 docOut,posOut,payOut是三个文件的文件描述符。...原创 2019-03-08 12:48:24 · 895 阅读 · 0 评论 -
Lucene源码分析 - FST
lucene的FST的二进制存储和查询方式都是由FST这个类来实现。如果要读这些代码,首先需要了解这个类里面的一些基本的东西。原创 2019-03-01 19:37:12 · 4766 阅读 · 1 评论