搜索引擎lucene实现思路 - 倒排索引/反向索引

本文探讨了ES(Elasticsearch)的核心组件Lucene及其使用的倒排索引技术。详细解释了正排索引与倒排索引的区别,以及在实际业务中如何通过不断新增关键词和使用分词技术来提高搜索效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ES的核心就是lucene

正排索引:关键词-》文档,通过关键词定位到文档

倒排索引:文档-》关键词,通过文档定位到关键词

1、管理员构建“关键词”,遍历文档,记录这些“关键词”在文档中的位置(也就是倒排索引);查询关键词的时候就能快速定位到这些文档的相关信息。

2、但是现实业务不会只使用“关键词”查询的,所以一方面要不断的新增“关键词”应对业务的变化,一方面需要分词技术将业务查询的语句分出多个系统能够识别的“关键词”,然后通过“关键词”查到相关文章。

3、再根据查询到的文章进行一系列算法得分,按照得分排序,进行显示。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值