Lucene 7.5.0 索引文件之pos&&pay

本文详细介绍了Lucene索引中的核心概念:position、payload及offset。position表示term在文档中的位置;payload为自定义元数据,用于描述term属性;offset则记录了term在文档中的起始与结束位置。这些信息在构建倒排索引过程中被计算并持久化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

position在Lucene中描述的是一个term在一篇文档中的位置,并且存在一个或多个position。 payload是一个自定义的元数据(mete data)来描述term的某个属性,term在一篇文章中的多个位置可以一一对应多个payload,也可以只有部分位置带有payload。 offset是一对整数值(a pair of integers),即startOffset跟endOffset,它们分别描述了term的第一个字符跟最后一个在文档中的位置。 每一个term在所有文档中的position、payload、offset信息在addDocument()的过程中计算出来,在内存中生成一张倒排表,最终持久化到磁盘时,通过读取倒排表,将position信息写入到.pos文件中,将payload、offset信息写入到.pay文件中。

看这里:http://www.amazingkoala.com.cn/Lucene/suoyinwenjian/2019/0324/41.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值