Lucene

博客介绍了Lucene全文磁力搜索,包括数据存储和查询。存储时,创建文档源对象,确定磁盘路径,将文档按属性字段存入数据区,值按分词策略存入索引区,会生成docId。查询时,用相同分词器,检索索引区词条,查数据区文档并打分,返回docId数组再查属性字段。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Lucene 全文磁力搜索

数据区(Field域document文档) + 索引区(分词后的词条)

 

数据存:

  1. 创建文档源对象,确定存储的磁盘路径
  2. 将文档源对象按照属性字段存入 数据区
  3. 文档中的值按照一定的分词策略存入 索引区
  4. 一次文档的存储,会在数据区给这个文档生成一个docId,该文档下有多个属性字段

 

数据查:

  1. 采用与存相同的分词器
  2. 按照条件检索 索引区 的词条
  3. 根据检索后的词条,查询 数据区 对应的文档,并为匹配上的文档打分(匹配度)
  4. 返回一个docId的数组
  5. 根据docId查询数据区的属性字段
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值