(1)数据写入buffer
(2)commit point
(3)buffer中的数据写入新的index segment
(4)等待在os cache中的index segment被fsync强制刷到磁盘上
(5)新的index sgement被打开,供search使用
(6)buffer被清空
每次commit point时,会有一个.del文件,标记了哪些segment中的哪些document被标记为deleted了
搜索的时候,会依次查询所有的segment,从旧的到新的,比如被修改过的document,在旧的segment中,会标记为deleted,在新的segment中会有其新的数据

本文详细解析了Lucene的索引更新流程,包括数据写入缓存、创建新的索引段、数据同步到磁盘、旧数据标记删除等关键步骤,以及搜索时如何处理已修改文档的最新数据。
425

被折叠的 条评论
为什么被折叠?



