elasticsearch时间字段的处理

本文介绍如何确保Elasticsearch索引映射与Logstash解析的数据字段一致性,包括解决因字段名称不匹配导致的问题,以及配置Logstash从Redis读取JSON数据并将其正确导入ES的具体步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先,确报创建索引是的mapping字段和json写入的字段名称一致,否则会有意想不到的问题。刚开始,redis里的json字符串字段为regular_detail_hour,但是,我在创建索引时写的为:regular_detail_time。通过logstash写入到ES,并不报错,只是新建了一个叫regular_detail_hour的字段。
通过bean实例化了一个json,然后通过RedisTemplate

 ListOperations<String,String> liststring=redisTemplate.opsForList();
        liststring.rightPush(key,value);
        return(true);

写入到redis数据,list类型。
logstash会通过消息队列类型的操作去读取数据,读完就删。

input {
    redis {
             host => "172.19.112.4"
             data_type => "list"
             key => "di"
             type => "di"
          }
}

filter {
  if [type] == "di" {
    json { source => "message"}
    mutate { remove_field => ["message","tags"] }
    date { match => [ "rept_col_time", "yyyy-MM-dd HH:mm:ss" ]  
           target =>"@timestamp"
           locale => "en"  
           timezone => "+00:00"    
         }  
     }
}

output {
   if [type] == "di"{
    if "_grokparsefailure" not in [tags] and "_groktimeout" not in [tags]{
       elasticsearch {
         hosts => ["10.96.91.208:9200","10.96.91.209:9200","10.96.91.210:9200","10.96.91.211:9200"]
         index => "di"
      }
   }
  }
}

另一边,ElasticSearch,也进行日期类型的处理,必须和json字符串的格式一样,否则出错。

put di
{
   "mappings" : {
        "di" : {
                 "properties" : {
                                  "@timestamp": {"type": "date"},
                                  "@version": {"type": "text","fields": {"keyword": {"type": "keyword","ignore_above": 256}}},
                                  "rpt_id" : { "type" : "keyword" },
                                  "iiiii" : { "type" : "keyword" },
                                  "data_type" : { "type" : "keyword" },
                                  "rpt_arrive_time" : { "type" : "date","format": "yyyy-MM-dd HH:mm:ss"},
                                  "filename" : { "type" : "keyword" },
                                  "observe_time" : { "type" : "date","format": "yyyy-MM-dd HH:mm:ss" },
                                  "regular_detail_hour" : { "type" : "date" ,"format": "yyyy-MM-dd HH:mm:ss"},
                                  "bbb" : { "type" : "keyword" },
                                  "rept_validity" : { "type" : "short" },
                                  "rept_status" : { "type" : "short" },
                                  "rept_col_time" : { "type" : "date","format":"yyyy-MM-dd HH:mm:ss"},
                                  "data_source" : { "type" : "keyword" },
                                  "data_source_name" : { "type" : "keyword" },
                                  "part_day" : { "type" : "short" },
                                  "data_type_new":{"type" : "keyword"}
            }
        }
    }
}

至此结束

### Elasticsearch 时间处理方法与教程 在 Elasticsearch 中,时间处理是一项非常重要的功能,尤其是在日志分析、监控和数据检索场景中。以下是关于 Elasticsearch 时间处理的一些关键方法和教程。 #### 1. 时间字段的映射 在创建索引时,需要为时间字段定义正确的映射类型。通常使用 `date` 类型来表示时间字段。例如: ```json PUT my_index { "mappings": { "properties": { "@timestamp": { "type": "date", "format": "strict_date_optional_time||epoch_millis" } } } } ``` 上述代码定义了 `@timestamp` 字段为日期类型,并支持两种格式:标准日期时间格式和毫秒级时间戳[^1]。 #### 2. 查询中的时间范围过滤 Elasticsearch 提供了强大的查询 DSL 来处理时间范围。可以使用 `rangeQuery` 方法来实现时间范围过滤。例如,在 Java 中可以通过以下方式设置时间范围和时区: ```java QueryBuilder rangeBuilder = QueryBuilders.rangeQuery("@timestamp") .format("yyyy-MM-dd'T'HH:mm:ss.SSS'Z'") .timeZone("+08:00") // 设置时区为东八区 .gte("2023-01-01T00:00:00.000Z") // 起始时间 .lte("2023-12-31T23:59:59.999Z"); // 结束时间 ``` 通过 `.timeZone()` 方法可以指定查询时的时区,确保不同地区的时间一致性[^2]。 #### 3. 使用时间戳存储时间 为了提高性能,Elasticsearch 常用时间戳(`epoch_millis`)来存储时间时间戳是以毫秒为单位的 Unix 时间。在插入数据时,可以直接使用时间戳格式。例如: ```json POST my_index/_doc { "@timestamp": 1672531200000 // 2023-01-01T00:00:00Z } ``` 在查询时,也可以直接使用时间戳进行范围过滤: ```json GET my_index/_search { "query": { "range": { "@timestamp": { "gte": 1672531200000, "lte": 1672617600000 } } } } ``` #### 4. 时间格式化与解析 Elasticsearch 支持多种时间格式,包括 ISO 8601 标准格式和自定义格式。如果需要自定义时间格式,可以在索引映射中指定。例如: ```json PUT my_index { "mappings": { "properties": { "custom_date": { "type": "date", "format": "yyyy/MM/dd HH:mm:ss||epoch_millis" } } } } ``` 上述代码定义了一个名为 `custom_date` 的字段,支持两种时间格式:`yyyy/MM/dd HH:mm:ss` 和 `epoch_millis`[^1]。 #### 5. 时间字段的动态映射 如果未显式定义时间字段的映射,Elasticsearch 会尝试自动检测并将其映射为 `date` 类型。但为了避免潜在问题,建议始终显式定义时间字段的映射。 #### 6. 时间分区索引 对于大规模时间序列数据,推荐使用时间分区索引(Time-Based Indexing)。例如,按天或按月创建索引,可以显著提升查询性能。索引名称可以包含日期模板,如 `logs-YYYY.MM.DD`。 ```bash PUT logs-2023.01.01 { "mappings": { "properties": { "@timestamp": { "type": "date" } } } } ``` ### 示例代码 以下是一个完整的 Java 示例,展示如何结合时区和时间范围进行查询: ```java import org.elasticsearch.index.query.QueryBuilders; QueryBuilder rangeBuilder = QueryBuilders.rangeQuery("@timestamp") .format("yyyy-MM-dd'T'HH:mm:ss.SSS'Z'") .timeZone("+08:00") // 设置时区为东八区 .gte("2023-01-01T00:00:00.000Z") .lte("2023-12-31T23:59:59.999Z"); // 构建搜索请求 SearchSourceBuilder sourceBuilder = new SearchSourceBuilder(); sourceBuilder.query(rangeBuilder); ``` ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值