Elasticsearch搜索高级特性详解
1. 相关性得分解释
在使用Elasticsearch进行搜索时,我们常常会得到一个相关性得分,但这个得分是如何计算的呢?Elasticsearch提供了两种机制来了解相关性得分的构成:explain标志和explain API。
1.1 Explain标志
在某些查询结果中,我们会看到一个正数,这就是相关性得分。若想了解这个得分是如何计算的,可以在查询体中设置explain标志为true。示例代码如下:
GET movies/_search
{
"explain": true,
"_source": false,
"query": {
"match": {
"title": "Lord"
}
}
}
设置explain为true后,Elasticsearch会返回结果,并详细说明得分的计算过程。相关性得分由三个组件相乘得到:逆文档频率(idf)、词频(tf)和提升因子。具体计算公式如下:
- 逆文档频率(idf):$log(1 + (N - n + 0.5) / (n + 0.5))$
- $n$:包含该词的文档总数
- $N$:文档总数
- 词频(tf):$freq / (freq + k1 * (1 - b + b * dl / avgdl))$
如果查询没有匹配结果,比如将“Lord”误写成“Lords”,结果将为空。
1.2 Explain API
除了使用exp
Elasticsearch搜索高级特性解析
超级会员免费看
订阅专栏 解锁全文
36

被折叠的 条评论
为什么被折叠?



