Elasticsearch权威指南：排序与相关性详解-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00985/article/details/148575859

Elasticsearch权威指南：排序与相关性详解

elasticsearch-definitive-guide The Definitive Guide to Elasticsearch 项目地址: https://gitcode.com/gh_mirrors/el/elasticsearch-definitive-guide

理解排序与相关性基础

在Elasticsearch中，排序是搜索功能的核心组成部分。默认情况下，搜索结果按照相关性降序排列，这意味着最相关的文档会出现在结果列表的最前面。但什么是相关性？如何自定义排序规则？这正是本文要探讨的核心内容。

相关性排序原理

相关性在Elasticsearch中通过_score来量化表示，这是一个浮点数，数值越大表示文档与查询条件的匹配程度越高。当执行普通查询时，系统会自动计算每个文档的_score并按照这个值降序排列结果。

无相关性场景的处理

在某些情况下，查询可能不涉及相关性计算。例如使用过滤查询（filter）时：

GET /_search
{
    "query" : {
        "bool" : {
            "filter" : {
                "term" : { "user_id" : 1 }
            }
        }
    }
}

这种查询下：

所有匹配文档的_score都会是0
结果顺序实际上是随机的
系统跳过了相关性计算过程，提高了查询效率

如果确实需要为所有匹配文档赋予相同分数，可以使用constant_score查询：

GET /_search
{
    "query" : {
        "constant_score" : {
            "filter" : {
                "term" : { "user_id" : 1 }
            }
        }
    }
}

字段值排序实践

当相关性不重要时，我们可以按字段值排序。例如按日期降序排列：

GET /_search
{
    "query" : {
        "bool" : {
            "filter" : { "term" : { "user_id" : 1 }}
        }
    },
    "sort": { "date": { "order": "desc" }}
}

这种排序方式有几个特点：

结果中不再包含_score（设为null）
新增了sort字段，显示用于排序的实际值
日期字段内部以毫秒时间戳形式存储和比较

排序结果分析

典型排序结果示例：

{
    "_index": "us",
    "_type": "tweet",
    "_id": "14",
    "_score": null,
    "_source": { "date": "2014-09-24" },
    "sort": [ 1411516800000 ]
}

注意：

1411516800000对应2014-09-24 00:00:00 UTC
如果需要保留_score计算，可设置track_scores: true

高级排序技巧

多级排序

Elasticsearch支持多级排序，优先级按排序条件声明顺序决定：

"sort": [
    { "date": { "order": "desc" }},
    { "_score": { "order": "desc" }}
]

这意味着：

首先按日期降序排列
日期相同的文档再按_score降序排列

多值字段排序策略

对于多值字段（如标签数组），需要指定排序模式：

"sort": {
    "tags": {
        "order": "asc",
        "mode": "min"
    }
}

支持的模式包括：

min：取最小值排序
max：取最大值排序
avg：取平均值排序
sum：取总和排序

实用技巧与最佳实践

简写语法：可以直接指定字段名，默认升序排列
```
"sort": "number_of_children"
```
查询字符串排序：在URL中直接指定排序条件
```
GET /_search?sort=date:desc&sort=_score&q=search
```
性能考虑：避免不必要的_score计算，特别是在大数据集排序时

通过掌握这些排序技术，您可以灵活控制Elasticsearch的返回结果顺序，满足各种业务场景的需求。无论是简单的日期排序，还是复杂的多级多条件排序，Elasticsearch都提供了完善的解决方案。

elasticsearch-definitive-guide The Definitive Guide to Elasticsearch 项目地址: https://gitcode.com/gh_mirrors/el/elasticsearch-definitive-guide

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考