1.聚合的分类
聚合可以实现对文档数据的统计、分析、运算。聚合常见的分类:
• 桶(Bucket)聚合:用来对文档进行分组,比如
TermAggregation:按照文档字段值分组;
Date HIstogram:按照日期阶梯分组,例如一周为一组,或者一月为一组;
• 度量(Metric)聚合:用以计算一些值,比如:最大值、最小值、平均值等
Avg:求平均值;
Max:求最大值;
Min:求最小值;
Stats:同时求max、min、avg、sum等
• 管道(pipeline)聚合:其它聚合的结果为基础做聚合,例如按照酒店名称进行分组(桶聚合)完成之后,计算每一组酒店价格的平均值(度量聚合)
ES官方提供了几十种聚合方式,官方地址为ES官方地址。
我们需要注意的是,参与聚合的字段不能够是分词的字段,那样是没有意义的,参与聚合的字段类型可以是keyword、数值、日期、布尔类型。
2. DSL实现的 Bucket聚合
案例,假如现在要统计所有数据中的酒店品牌有几种,此时可以按照酒店品牌进行聚合。
语法如下:
GET /hotel/_search
{
"size":0,