Elasticsearch聚合

一、按sum聚合的结果做排序

{
  "query": {
    "match_all": {}
  },
  "aggregations": {
    "leo": {
      "terms": {
        "script": "_source.time.split(' ')[0]+':'+_source.workflow",
        "order": {
          "leo2": "asc"
        }
      },
      "aggregations": {
        "leo2": {
          "sum": {
            "field": "errcode"
          }
        }
      }
    }
  }
}

二、按时间粒度做聚合

//DSL查询语句为:
{
  "query": {
    "match_all": {}
  },
  "aggregations": {
    "agg": {
      "date_histogram": {
        "field": "time",
        "interval": "1h",
        "min_doc_count": 0,
        "format": "yyyy-MM-dd HH:mm:ss"
      },
      "aggregations": {
        "max-userrate": {
          "max": {
            "field": "userrate"
          }
        },
        "max-bandwidthrate": {
          "max": {
            "field": "bandwidthrate"
          }
        },
        "max-spacerate": {
          "max": {
            "field": "spacerate"
          }
        }
      }
    }
  }
}

//二次聚合
{
  "size": 1,
  "query": {
    "match_all": {}
  },
  "aggregations": {
    "agg": {
      "date_histogram": {
        "field": "logtime",
        "interval": "1d",
        "min_doc_count": 0,
        "format": "yyyyMMddHHmmss"
      },
      "aggregations": {
        "agg1": {
          "date_histogram": {
            "field": "logtime",
            "interval": "5m",
            "min_doc_count": 0,
            "format": "yyyyMMddHHmmss"
          }
        }
      }
    }
  }
}

Java API为

        switch(particle)
        {
            case Constant.particle_10m:
                aggregation = AggregationBuilders.dateHistogram("agg")
                                                 .field("time")
                                                 .interval(DateHistogram.Interval.minutes(10))
                                                 .format("yyyy-MM-dd HH:mm:ss")
                                                 .minDocCount(0);
                break;
            case Constant.particle_1h:
                aggregation = AggregationBuilders.dateHistogram("agg")
                                                 .field("time")
                                                 .interval(DateHistogram.Interval.HOUR)
                                                 .format("yyyy-MM-dd HH:mm:ss")
                                                 .minDocCount(0);
                break;
            case Constant.particle_1d:
                aggregation = AggregationBuilders.dateHistogram("agg")
                                                 .field("time")
                                                 .interval(DateHistogram.Interval.DAY)
                                                 .format("yyyy-MM-dd HH:mm:ss")
                                                 .minDocCount(0);
                break;
            case Constant.particle_1w:
                aggregation = AggregationBuilders.dateHistogram("agg")
                                                 .field("time")
                                                 .interval(DateHistogram.Interval.WEEK)
                                                 .format("yyyy-MM-dd HH:mm:ss")
                                                 .minDocCount(0);
                break;
            case Constant.particle_1M:
                aggregation = AggregationBuilders.dateHistogram("agg")
                                                 .field("time")
                                                 .interval(DateHistogram.Interval.MONTH)
                                                 .format("yyyy-MM-dd HH:mm:ss")
                                                 .minDocCount(0);
                break;
            case Constant.particle_1s:
                aggregation = AggregationBuilders.dateHistogram("agg")
                                                 .field("time")
                                                 .interval(DateHistogram.Interval.QUARTER)
                                                 .format("yyyy-MM-dd HH:mm:ss")
                                                 .minDocCount(0);
                break;
            default:
        }

三、按时间粒度做双重聚合后按sum排序

{
  "size": 0,
  "query": {
    "match_all": {}
  },
  "aggregations": {
    "agg1": {
      "date_histogram": {
        "field": "logtime",
        "interval": "1d",
        "min_doc_count": 0,
        "format": "yyyy-MM-dd HH:mm:ss"
      },
      "aggregations": {
        "agg2": {
          "date_histogram": {
            "field": "logtime",
            "interval": "5m",
            "min_doc_count": 0,
            "format": "yyyy-MM-dd HH:mm:ss",
            "order":{
               "leo2":"asc"
            }
          },
          "aggregations": {
          "leo2": {
            "sum": {
              "field": "totalsum"
            }
          }
         }
        }
      }
    }
  }
}
### 使用Elasticsearch聚合功能 #### 设置环境并执行基本聚合查询 为了利用Elasticsearch的强大聚合能力,首先需要确保已安装配置好Elasticsearch集群,并通过RESTful API接口与其交互。对于简单的聚合操作,比如基于单个字段进行统计汇总,可以直接构建`terms`类型的聚合查询。 ```json GET /es_db/_search { "size": 0, "aggs": { "hs_remark_agg": { "terms": { "field": "remark.keyword" } } } } ``` 上述命令展示了如何创建一个仅返回聚合结果而不展示具体文档详情的请求[^4]。这里设置了`size: 0`来指示服务器忽略具体的匹配项而专注于聚合部分的结果集处理。 #### 多字段复合聚合实现 当涉及到多个维度的同时分析时,则可采用更复杂的结构——即所谓的“桶内嵌套”。这允许在一个更大的分类下进一步细分数据点。例如,在测试案例中验证了多字段组合的有效性[^1]: ```json POST /your_index_name/_search?size=0 { "query": {}, "aggs": { "composite_aggregation_example": { "composite": { "sources": [ {"source_field_1": {"terms": {"field": "field_one"}}}, {"source_field_2": {"terms": {"field": "field_two"}}} ] } } } } ``` 这段JSON定义了一个名为`composite_aggregation_example`的新聚合器实例,其中包含了两个源字段作为分组依据。这种设计非常适合于探索不同属性之间的关系以及它们共同影响下的分布情况。 #### 应用场景举例说明 实际应用方面,Elasticsearch聚合特性广泛适用于各类数据分析需求。无论是追踪用户行为轨迹还是评估产品性能表现,亦或是研究人力资源状况等都能找到合适的解决方案[^2]。例如,可以通过聚合获取某段时间内的平均响应时间、最常访问页面路径或者是最高收入的商品类别等等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值