Lucene/Solr
文章平均质量分 95
Lucene/Solr
GLeon.Sun
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Solr BlockCache
Solr BlockCache概述源码分析初始化BlockCacheBlockDirectoryCacheBlockDirectory写流程读流程 概述 Solr 中为了加速索引在 HDFS 上的读写,增加了缓存,相关代码均位于 org.apache.solr.store.blockcache 包中。 源码分析 本篇源码基于 lucene-solr-8.5.2。 初始化 初始化的过程位于 HdfsDirectoryFactory 的 create 方法中,启用 BlockCache 需要配置对应参数,可参考原创 2021-04-21 10:40:57 · 394 阅读 · 0 评论 -
Lucene源码分析 - 倒排索引之索引表
概要 前文已经介绍过什么是倒排索引了,本文将对倒排索引的结构深入进行理解,见下图 整个倒排索引其实分为两部分,左边是Term Dictionary,右边是Postings List,例如对以下内容建立倒排索引,结构较为贴近HashMap>,可类比设想Map的key为Term,value为Postings ...原创 2020-03-14 16:30:48 · 1360 阅读 · 0 评论 -
Lucene源码分析 - 索引创建过程
Lucene的诞生背景 传统数据库 常见数据结构: 结构化数据:表、字段表示的数据 半结构化数据:xml、html等 非结构化数据:文本、文档、图片、音频、视频等 索引原理:对列值创建排序存储,数据结构={列值、行地址},在有序数据列表中就可以利用二分查找快速找到要查找的行的地址,再根据地址直接取行数据 索引特点:数据库适合结构化数据的精确查询,而不适合半结构化、非结构化数...原创 2019-08-21 11:02:18 · 1167 阅读 · 0 评论
分享