solr 相关度评分,自定义评分

本文介绍了如何在Solr中自定义相关度评分,以满足特定的业务需求。通过重写DefaultSimilarityFactory和BootSimilarity的simScorer方法,简化评分规则,如按标题和正文包含关键字及文章质量分进行排序。详细步骤和效果对比图也在文中呈现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ps:临时写的,大体的实现和简单版, 以后会不断完善 博客和 代码

github:https://github.com/Eric-ly/solr_engine

solr是基于lucene的全文检索 搜索引擎,和一般查数据库相比,solr的一个特色就是它的相关度评分。 这里介绍一下它的自定义 相关度评分。

solr的评分是需要考虑很多因素的 有一个公式,比如会考虑 一句话中 关键字出现的频率,一片文章中关键字出现的频率和这篇文章的长度 来综合计算相关度评分。

在实际的业务中,可能不需要这么复杂的相关度,是需要简单粗暴的 按照我指定的规则计算相关度,并按照相关度进行排序。使用默认的话 因为因素过多 (比如分数小数太多) 可能不能让评分按照我自己的方式计算(最后分数)即最后的分数会有差别。

需求问题,比如:

我只想要 滑雪 加10分 然后我根据标题包含滑雪的排序

1.标题 含滑雪 > 标题 不含 滑雪

2.正文含滑雪 >正文不含滑雪

3.文章的质量分 高大于 低

这个时候如果用默认的 我无法 在滑雪中根据正文包含 或者 质量分进行二层,三层排序, 因为 条件1 (标题中包含 滑雪关键字的 )的评分 就不一样 导致 排序结果 从一开始就是错误的

所以我需要一个按照我自己定义的规则计算的相关度评分。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值