Elasticsearch 查询案例解析-ES求中位数

本文展示了如何在Elasticsearch中通过查询计算一个字段(如score)的中位数,首先创建索引并添加测试数据,然后利用聚合功能中的percentiles计算50th百分位数,即中位数,结果显示中位数为88.5。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

中位数的计算:

(1)首先要先排序(从小到大),然后计算中位数的序号,分数据为奇数个与偶数个两种来求.
(2)中位数算出来可避免极端数据,代表着数据总体的中等情况。
(3)如果总数个数是奇数的话,按从小到大的顺序,取中间的那个数
(4)如果总数个数是偶数个的话,按从小到大的顺序,取中间那两个数的平均数 

1、创建一个测试索引

PUT test
{
  "settings": {
    "number_of_shards": 5,
    "number_of_replicas": 0
  },
  "mappings": {
    "properties": {
      "id": {
        "type": "long"
      },
      "name": {
        "type": "text"
      },
      "score": {
        "type": "double"
      }
    }
  }
}

2、添加测试数据

POST test/_doc/1
{
  "id": 1,
  "name": "aaa",
  "score": 96
}

POST test/_doc/2
{
  "id": 2,
  "name": "bbb",
  "score": 90
}

POST test/_doc/3
{
  "id": 3,
  "name": "bbb",
  "score": 90
}

POST test/_doc/4
{
  "id": 4,
  "name": "ccc",
  "score": 87
}

POST test/_doc/5
{
  "id": 5,
  "name": "ddd",
  "score": 80
}

POST test/_doc/6
{
  "id": 6,
  "name": "eee",
  "score": 78
}

3、求score分数的中位数

GET test/_search?pretty
{
  "size": 0,
  "query": {
    "bool": {
      "must": [
        {
          "match_all": {}
        }
      ]
    }
  },
  "aggs": {
    "percentiles": {
      "percentiles": {
        "field": "score",
        "percents": [
          50
        ]
      }
    }
  }
}

获取结果

{
  "took" : 275,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 6,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
    "percentiles" : {
      "values" : {
        "50.0" : 88.5
      }
    }
  }
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值