Elasticsearch权威指南：聚合分析中的额外指标应用-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00604/article/details/148576971

Elasticsearch权威指南：聚合分析中的额外指标应用

elasticsearch-definitive-guide The Definitive Guide to Elasticsearch 项目地址: https://gitcode.com/gh_mirrors/el/elasticsearch-definitive-guide

理解聚合中的多指标计算

在Elasticsearch的聚合分析中，我们不仅可以计算基本的统计指标，还可以通过嵌套聚合实现更复杂的多维度分析。本文将通过一个汽车交易数据的案例，展示如何在聚合中添加额外的指标计算，从而获得更丰富的分析结果。

案例背景

假设我们有一个汽车交易数据集，其中包含车辆颜色、制造商和价格等信息。我们已经能够通过聚合分析计算不同颜色车辆的平均价格，以及每种颜色下各制造商的分布情况。现在，我们需要进一步扩展分析维度，计算每个制造商的最低和最高价格。

聚合查询结构解析

以下是实现这一需求的完整聚合查询：

GET /cars/transactions/_search
{
   "size" : 0,
   "aggs": {
      "colors": {
         "terms": {
            "field": "color"
         },
         "aggs": {
            "avg_price": { "avg": { "field": "price" }},
            "make" : {
                "terms" : {
                    "field" : "make"
                },
                "aggs" : {
                    "min_price" : { "min": { "field": "price"} },
                    "max_price" : { "max": { "field": "price"} }
                }
            }
         }
      }
   }
}

这个查询的结构可以分为以下几个层次：

顶层聚合：按颜色分组（colors聚合）
第一级子聚合：
- 计算每种颜色的平均价格（avg_price）
- 按制造商分组（make聚合）
第二级子聚合（嵌套在make聚合中）：
- 计算每个制造商的最低价格（min_price）
- 计算每个制造商的最高价格（max_price）

查询结果解读

查询返回的结果可能如下所示（以红色车辆为例）：

{
   "aggregations": {
      "colors": {
         "buckets": [
            {
               "key": "red",
               "doc_count": 4,
               "make": {
                  "buckets": [
                     {
                        "key": "honda",
                        "doc_count": 3,
                        "min_price": {
                           "value": 10000
                        },
                        "max_price": {
                           "value": 20000
                        }
                     },
                     {
                        "key": "bmw",
                        "doc_count": 1,
                        "min_price": {
                           "value": 80000
                        },
                        "max_price": {
                           "value": 80000
                        }
                     }
                  ]
               },
               "avg_price": {
                  "value": 32500
               }
            }
         ]
      }
   }
}

从结果中我们可以提取出以下关键信息：