ES底层分数计算逻辑
relevance score算法,简单来说,就是计算出,一个索引中的文本,与搜索文本,他们之间的关联匹配程度。Elasticsearch使用的是 term frequency/inverse document frequency算法,简称为TF/IDF算法
Term frequency:搜索文本中的各个词条在field文本中出现了多少次,出现次数越多,就越相关
PUT /score/_doc/1
{
"doc":"hello you, and world is very good"
}
PUT /score/_doc/2
{
"doc":"hello, how are you"
本文深入探讨了ElasticSearch的评分机制,主要基于TF/IDF算法。TF(Term Frequency)衡量词条在文档中出现的次数,IDF(Inverse Document Frequency)评估词条的普遍性。还详细介绍了 IDF 的计算公式以及TF的计算公式,涉及到boost、k1、b等参数的影响。通过示例展示了如何计算文档的score,并指出字段长度对评分的影响。
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



