ElasticSearch使用elasticsearchTemplate聚合查询

本文详细介绍了如何在Elasticsearch中使用聚合查询处理实际业务需求,通过示例展示了如何结合`term`、`nested`和`bucket_selector`等高级特性筛选地址数据。同时,提供了Java API的实现代码和常用聚合函数的概述。

这两天正好做个需求,需要用到聚合查询。前几篇文章只是简单的提到过,并没有真正的运用到实际产出中,本篇结合实际代码,专项学习ES的聚合查询。

1、业务背景

有一张地址索引表:
在这里插入图片描述
hisAddress与formatAddress是一对多的关系。
当一条地址进来查找hisAddress,然后对formatAddress做聚合,再根据count筛选聚合中的数据。
类似以下SQL:

select hisAddress,formatAddress,count(*) from addressIndex 
where hisAddress = "上海市静安区静安路100号静安寺" 
group by formatAddress having count(*) > 10

当然逻辑比这个稍稍复杂,需要使用嵌套聚合筛选数据。
流程如下:
在这里插入图片描述

2、elasticsearch的query

{
"size":0,
"query":{
	"bool":{
		"filter":{
			"term":{
				"hisAddress":"上海市上海市静安区静安路100号静安寺"
			}
		}
	}
},
"aggs":{
	"format_address":{		
			"terms":{
				"field":"formatAddress" 
			},
			
			"aggs":{
				"sign_org":{
					"terms":{
						"field":"signOrgCode"
					}
				},
				
				"having":{
					"bucket_selector":{
						"buckets_path":{
							"formatCount":"_count"		
						},
						"script":{						
		            		"inline": " formatCount>10"
						}							
					}
				},
			
				"stats_sign_bulk":{
					"stats_bucket":{
						"buckets_path":"sign_org > _count"
					}
				}
			}
	}
}
}

返回结果:

{
    "took": 19,
    "timed_out": false,
    "_shards": {
        "total": 6,
        "successful": 6,
        "failed": 0
    },
    "hits": {
        "total": 67,
        "max_score": 0,
        "hits": []
    },
    "aggregations": {
        "format_address": {
            "doc_count_error_upper_bound": 0,
            "sum_other_doc_count": 0,
            "buckets": [
                {
                    "key": "上海市上海市静安区静安寺",
                    "doc_count": 21,
                    "sign_org": {
                        "doc_count_error_upper_bound": 0,
                        "sum_other_doc_count": 0,
                        "buckets": [
                            {
                                "key": "022795",
                                "doc_count": 21
                            }
                        ]
                    },
                    "stats_sign_bulk": {
                        "count": 1,
                        "min": 21,
                        "max": 21,
                        "avg": 21,
                        "sum": 21
                    }
                },
                {
                    "key": "上海市上海市静安区静安路100号",
                    "doc_count": 21,
                    "sign_org": {
                        "doc_count_error_upper_bound": 0,
                        "sum_other_doc_count": 0,
                        "buckets": [
                            {
                                "key": "022795",
                                "doc_count": 21
                            }
                        ]
                    },
                    "stats_sign_bulk": {
                        "count": 1,
                        "min": 21,
                        "max": 21,
                        "avg": 21,
                        "sum": 21
                    }
                },
                {
                    "key": "上海市上海市静安区肯德基",
                    "doc_count": 16,
                    "sign_org": {
                        "doc_count_error_upper_bound": 0,
                        "sum_other_doc_count": 0,
                        "buckets": [
                            {
                                "key": "01111",
                                "doc_count": 16
                            }
                        ]
                    },
                    "stats_sign_bulk": {
                        "count": 1,
                        "min": 16,
                        "max": 16,
                        "avg": 16,
                        "sum": 16
                    }
                }
            ]
        }
    }
}

3、elasticsearchTemplate的实现

String hisAddress = "上海市上海市静安区静安路100号静安寺";
List<HistoryIndexDocument> prepareList = new ArrayList<HistoryIndexDocument>();
Map<String,String> bucketMap = new HashMap<String, String>();
bucketMap.put("formatCount", "_count");

// 根据全量地址和寄派类型查询数据(此处使用filter过滤,它能缓存数据且不参与计算分值,比query速度快)
QueryBuilder queryBuilder = QueryBuilders
		.boolQuery()
		.filter(QueryBuilders.termQuery("hisAddress", entity.getHisAddress()))
		.filter(QueryBuilders.termQuery("rangeType", entity.getRangeType()));
	// 结构化地址聚合桶
TermsBuilder format_address_aggs = AggregationBuilders.terms("format_address_aggs").field("formatAddress");
	// 签收网点聚合桶
TermsBuilder sign_org_aggs = AggregationBuilders.terms("sign_org_aggs").field("signOrgCode");
// 管道聚合,类似having count(*) > 10
BucketSelectorBuilder bucketSelectorBuilder = PipelineAggregatorBuilders
 			.having("having")
 			.setBucketsPathsMap(bucketMap)
 			.script(new Script("formatCount>10"));

// 嵌套聚合,类似在group by formatAddress的基础上再group by signOrgCode
format_address_aggs.subAggregation(sign_org_aggs);
// 嵌套聚合,筛选数量大于10的结构化地址
format_address_aggs.subAggregation(bucketSelectorBuilder);
// 嵌套聚合,筛选数量大于10的签收网点
sign_org_aggs.subAggregation(bucketSelectorBuilder);

SearchQuery searchQuery = new NativeSearchQueryBuilder()
		.withIndices("my_index").withTypes("my_type")
		.withQuery(queryBuilder)
		.withPageable(new PageRequest(0, 1, null))
		.addAggregation(format_address_aggs)
		.build();

// 执行语句获取聚合结果
Aggregations aggregations = elasticsearchTemplate.query(searchQuery, new ResultsExtractor<Aggregations>() {

	@Override
	public Aggregations extract(SearchResponse response) {
		return response.getAggregations();
	}
});

// 获取聚合结果
StringTerms teamAgg = (StringTerms) aggregations.asMap().get("format_address_aggs");
List<Bucket> bucketList = teamAgg.getBuckets();
for(Bucket bucket:bucketList) {
	// 结构化地址
	String formatAddress = bucket.getKeyAsString();
	System.out.println(formatAddress);
	
	Aggregations signAggs = bucket.getAggregations();
	StringTerms signTerms = (StringTerms) signAggs.asMap().get("sign_org_aggs");
	List<Bucket> signBucketList = signTerms.getBuckets();
	// 签收网点只能一个
	if(signBucketList==null || signBucketList.size() >1) {
		continue;
	}
	
	Bucket signBucket = signBucketList.get(0);
	// 签收频次需要5次以上
	if(signBucket.getDocCount() >= 5) {
		
		// 满足条件的网点放入prepareList
		HistoryIndexDocument entity = new HistoryIndexDocument();
		entity.setFormatAddress(formatAddress);
		entity.setSignOrgCode(signBucket.getKeyAsString());
		prepareList.add(entity);
	}
}

System.out.println(FastJsonUtil.toJsonString(prepareList));

4、更多java API聚合的用法

//(1)统计某个字段的数量
  ValueCountBuilder vcb=  AggregationBuilders.count("count_uid").field("uid");
//(2)去重统计某个字段的数量(有少量误差)
 CardinalityBuilder cb= AggregationBuilders.cardinality("distinct_count_uid").field("uid");
//(3)聚合过滤
FilterAggregationBuilder fab= AggregationBuilders.filter("uid_filter").filter(QueryBuilders.queryStringQuery("uid:001"));
//(4)按某个字段分组
TermsBuilder tb=  AggregationBuilders.terms("group_name").field("name");
//(5)求和
SumBuilder  sumBuilder=	AggregationBuilders.sum("sum_price").field("price");
//(6)求平均
AvgBuilder ab= AggregationBuilders.avg("avg_price").field("price");
//(7)求最大值
MaxBuilder mb= AggregationBuilders.max("max_price").field("price"); 
//(8)求最小值
MinBuilder min=	AggregationBuilders.min("min_price").field("price");
//(9)按日期间隔分组
DateHistogramBuilder dhb= AggregationBuilders.dateHistogram("dh").field("date");
//(10)获取聚合里面的结果
TopHitsBuilder thb=  AggregationBuilders.topHits("top_result");
//(11)嵌套的聚合
NestedBuilder nb= AggregationBuilders.nested("negsted_path").path("quests");
//(12)反转嵌套
AggregationBuilders.reverseNested("res_negsted").path("kps ");

了解更多详情,请参考官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/6.5/search-aggregations.html
本文参考:https://blog.youkuaiyun.com/u010454030/article/details/63266035

<think>好的,我现在需要回答用户关于Elasticsearch Repositories和ElasticsearchTemplate使用场景及功能对比的问题。首先,我应该回顾一下用户提供的引用内容,看看有没有相关的信息可以利用。 用户给出的引用中,引用[1]提到了DemoRepository接口继承了ElasticsearchRepository,这可能涉及Repositories的使用方式。引用[5]提到了在application.yml中配置Elasticsearch的相关设置,包括cluster-nodes和cluster-name,这可能与ElasticsearchTemplate的配置有关。而引用[2]讨论了Elasticsearch与MySQL的对比,虽然不直接相关,但可能帮助理解Elasticsearch的结构。 接下来,我需要回忆Spring Data Elasticsearch中的这两个组件。Elasticsearch Repositories是基于Spring Data的repository抽象,通过定义接口来自动生成查询方法,类似于JPA的repository。而ElasticsearchTemplate则提供了更底层的操作,允许直接使用Elasticsearch的API,适合复杂查询和自定义操作。 功能对比方面,Repositories适合标准的CRUD操作,通过方法名自动生成查询,开发速度快。而ElasticsearchTemplate适合需要自定义查询逻辑的情况,比如复杂的聚合、脚本执行等。使用场景上,如果项目需要快速开发,遵循领域驱动设计,Repositories更合适;如果需要高度定制化的查询或处理复杂的数据操作,ElasticsearchTemplate更合适。 需要确保回答结构清晰,分点说明差异,并引用用户提供的资料。例如,引用[1]中的DemoRepository示例可以说明Repositories的使用,而引用[5]中的配置可能与Template的初始化有关。同时,要指出版本差异可能带来的影响,如引用[3]提到的版本信息,可能影响两者的可用性和功能。 最后,生成相关问题时要围绕两者的选择、版本兼容性、性能比较以及组合使用等方面,帮助用户进一步探索。</think>### Elasticsearch Repositories vs ElasticsearchTemplate 功能对比 #### 1. **核心定位差异** - **Elasticsearch Repositories** 基于Spring Data的Repository抽象层实现,通过接口声明自动生成基础CRUD操作和查询方法(如`findByFieldName`),遵循约定优于配置原则。适用于**标准化操作**和**快速开发**场景[^1][^5]。 ```java // 示例:声明式查询方法 public interface UserRepository extends ElasticsearchRepository<User, String> { List<User> findByAgeGreaterThan(int age); } ``` - **ElasticsearchTemplate** 提供底层API操作入口(如`queryForPage`、`index`),支持完全自定义DSL查询、复杂聚合和脚本操作。适用于**复杂业务逻辑**和**细粒度控制**场景[^4][^5]。 ```java // 示例:自定义查询 QueryBuilder query = QueryBuilders.matchQuery("name", "John"); SearchHits<User> hits = elasticsearchTemplate.search( new NativeSearchQueryBuilder().withQuery(query).build(), User.class ); ``` --- #### 2. **功能特性对比** | **维度** | **Elasticsearch Repositories** | **ElasticsearchTemplate** | |----------------------|---------------------------------------------------------|---------------------------------------------------| | **查询生成方式** | 通过方法名自动生成查询 | 需手动编写QueryBuilder或JSON DSL | | **事务支持** | 依赖Spring事务管理 | 需显式控制操作序列 | | **灵活性** | 受限(仅支持简单条件组合) | 高(支持所有ES原生API) | | **性能优化** | 自动分页/批处理 | 需手动实现滚动查询(Scroll API)[^3] | | **版本兼容性** | 强依赖Spring Data版本(如3.x与ES 6.x兼容)[^3] | 兼容性更宽(直接操作REST Client) | --- #### 3. **典型使用场景** - **优先选择Repositories的场景** - 需要快速实现基础CRUD功能 - 使用领域驱动设计(DDD)模型 - 查询条件简单且可预测(如等值匹配、范围查询)[^2] - **优先选择ElasticsearchTemplate的场景** - 需要多索引联合查询或跨集群搜索 - 使用自定义评分模型(Function Score Query) - 执行Pipeline Aggregation等复杂聚合操作 - 需要直接操作低版本Transport Client(旧系统迁移)[^5] --- #### 4. **混合使用建议** 实际项目中常采用**组合模式**: ```java @Service public class UserService { @Autowired private UserRepository userRepository; // 标准操作 @Autowired private ElasticsearchTemplate template; // 复杂操作 public List<User> findInactiveUsers() { BoolQueryBuilder query = QueryBuilders.boolQuery() .must(QueryBuilders.rangeQuery("lastLogin").lt("now-30d")) .must(QueryBuilders.termQuery("status", "registered")); return template.queryForList(new NativeSearchQuery(query), User.class); } } ```
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值