elastic按小时统计当天数据

要实现这样一个功能
select count(1),小时 from user where createDate=今天 group by 每小时
原本以为很简单的一个聚合很容易找到相关资料,没想到花了好几个小时

首先建一个测试的index和type,分别为ksearch_test和user,
建立mapping

http://ip:port/ksearch_test/user/_mapping PUT


{
"user":{
"properties":{
"name":{
"type":"string",
"index":"not_analyzed" //不分词
},
"createDate":{
"type":"date",
"index":"not_analyzed"
}
}
}
}



实现聚合,按每小时统计当天数据:
http://ip:port/ksearch_test/user/_search POST

{
"size": 0,
"aggs": {
"group_by_state": {
"date_histogram": { //es提供的时间处理函数
"field": "createDate", //需要聚合的字段名字
"interval": "hour", //按小时group by
"format": "yyyy-MM-dd HH", //返回值格式化,HH大写,不然不能区分上午、下午
"min_doc_count": 0, //为空填充0
"extended_bounds": { //需要填充0的范围
"min": "2016-12-19 01",
"max": "2016-12-19 23"
}
}
}
},
"query": { //这就是where
"filtered": {
"filter": {
"range": {
"createDate": {
"gte": "2016-12-19T00:00:00.000",
"lt": "2016-12-20T00:00:00.000"
}
}
}
}
}
}


使用spring-data-elasticsearch在java中实现

@SuppressWarnings("deprecation")
@Test
public void group_by_day(){
String indexName = "ksearch_test3";
String typeName = "ks_user_trace";

//QueryBuilder queryBuilder = QueryBuilders.boolQuery().must(QueryBuilders.queryFilter(QueryBuilders.rangeQuery("create_time").gte("2016-11-19T01:00:00.000").lt("2016-12-19T00:00:00.000")));
QueryBuilder queryBuilder = QueryBuilders.queryFilter(QueryBuilders.rangeQuery("create_time").gte("2016-11-19T01:00:00.000").lt("2016-12-19T00:00:00.000"));


AbstractAggregationBuilder aggregation = AggregationBuilders.dateHistogram("group_by_day").field("create_time").interval(DateHistogramInterval.DAY).format("yyyy-MM-dd").minDocCount(0L).extendedBounds("2016-11-19", "2016-12-19");

SearchRequestBuilder reqBuilder = client.prepareSearch(indexName)
.setTypes(typeName)
.setQuery(queryBuilder)
.addAggregation(aggregation);


SearchResponse resp = reqBuilder.execute().actionGet();
Aggregations aggs = resp.getAggregations();
InternalHistogram agg = aggs.get("group_by_day");
List<Bucket> buckets = (List<Bucket>) agg.getBuckets();

for(Bucket bucket:buckets){
Long docCount = bucket.getDocCount();
String date = bucket.getKeyAsString();

System.out.println(date+":"+docCount);
}
}
### Elasticsearch 时间函数与日期操作 Elasticsearch 提供了一系列的时间和日期处理功能,这些功能可以帮助用户更灵活地查询、分析以及管理时间序列数据。以下是关于 Elasticsearch 中时间和日期相关的主要功能及其用法: #### 1. **`date` 数据类型** 在 Elasticsearch 的映射定义中,可以通过 `date` 类型指定字段存储时间为标准格式。支持的标准格式包括 ISO-8601 和自定义格式[^1]。 ```json { "mappings": { "properties": { "timestamp": { "type": "date", "format": "yyyy-MM-dd HH:mm:ss||epoch_millis" } } } } ``` 通过这种方式,可以确保时间字段能够被正确解析并用于后续的查询和聚合。 --- #### 2. **`range` 查询中的时间范围** Elasticsearch 支持基于时间范围的查询,允许用户筛选特定时间段内的记录。例如,以下查询语句展示了如何检索某个时间范围内(如最近一天)的数据[^1]: ```json { "query": { "range": { "timestamp": { "gte": "now-1d/d", "lt": "now/d" } } } } ``` 这里的 `now-1d/d` 表示当前时间减去一天,并按天对齐;而 `now/d` 则表示当天的起始时刻。 --- #### 3. **动态时间计算 (`script`)** 如果需要执行更加复杂的逻辑运算,比如基于时间戳进行加减或其他算术操作,则可以借助脚本语言实现。下面的例子演示了如何利用 Painless 脚本来增加或减少时间值[^2]: ```json { "script": { "source": """ Instant instant = Instant.ofEpochMilli(doc['timestamp'].value.toInstant().toEpochMilli()); ZonedDateTime zdt = ZonedDateTime.ofInstant(instant, ZoneId.systemDefault()); // 减少一天 ZonedDateTime newDate = zdt.minusDays(1); return DateTimeFormatter.ISO_DATE_TIME.format(newDate); """, "lang": "painless" } } ``` 此方法适用于高级场景下的时间调整需求。 --- #### 4. **`function_score` 结合时间衰减** 当希望某些较新的文档获得更高的评分权重时,可采用 `function_score` 配置中的 `decay_function` 功能。它可以根据距离目标时间越近赋予更高分值[^2]。 ```json { "query": { "function_score": { "functions": [ { "gauss": { "publish_date": { "origin": "2023-07-01", "scale": "10d", "offset": "5d", "decay": 0.5 } } } ], "score_mode": "multiply" } } } ``` 在此配置下,“发布日期”接近设定原点 (即 `"2023-07-01"` ) 的文档会被优先返回。 --- #### 5. **日期直方图聚合** 对于统计目的而言,经常需要用到按照固定间隔划分时间段的功能——这正是 `date_histogram` 所擅长之处[^1]。如下所示为每小时计数案例: ```json { "aggs": { "events_over_time": { "date_histogram": { "field": "eventTime", "fixed_interval": "1h", "min_doc_count": 0, "extended_bounds": { "min": "2023-01-01T00:00:00Z", "max": "2023-01-02T00:00:00Z" } } } } } ``` 该命令将把所有匹配事件依据其发生的具体小时分布出来。 --- #### 总结 以上介绍了几种常见的 Elasticsearch 时间处理方式,涵盖了基础映射设计、复杂条件过滤直至数据分析层面的应用实例。无论是简单的区间限定还是深入定制化排序策略均能轻松达成预期效果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值