lucene学习六:lucene全文检索与数据库查询的比较

本文探讨了Lucene全文检索与传统数据库查询的区别,主要从性能、相关度排序及准确性三个方面进行对比。Lucene通过建立索引库提高检索速度;采用特定算法实现文档的相关度排序;并且在准确性方面优于数据库的模糊查询。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关于lucene的具体概念和使用,本文不做具体的概述,具体通过一下三点探讨一下lucene全文检索与数据库查询的一些区别

1:性能上

数据库:比如我要查找某个商品,根据商品名,比如select * from product where doctname like %keywords%,这样查询的话对于数据量少是可以的,可是一旦你的数据量巨大几万几十万的时候,你的性能将会极大的减弱。

lucene:全文检索,建立一个索引库,一次建立多次使用。在索引库里面会把所有的商品名根据分词器建立索引,就好比新华字典,索引对应document,比如输入衬衫,那么就会根据索引迅速的翻到衬衫对应的商品名,时间迅速,性能很好。

2:相关度排序

数据库:数据库要实现该功能也是可以的,可是需要改变表的结构,添加一个字段,然后该字段用于排名,最后查询的时候order by 一下

lucene:查询出来的document都有一个算法(得分),根据算法可以计算得分,得分越高的排名越靠前,比如百度搜索一个东西,一般排名靠前的得分越高,得分通过算法,可以人工控制,比如百度推广,企业给的钱多得分自然高,因此排名靠前

3:准确性

数据库:select * from product where doctname like %ant%,搜索出来的可以是plant,aplant,planting等等,准确性不高

lucene:它是通过索引查询的,就好像你查字典一样,准确性比数据库的模糊查询高许多

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值