logstash 从elasticsearch中以csv的数据格式到hdfs

本文介绍了如何利用logstash从Elasticsearch读取数据,并经过filter处理后,以CSV格式存储到HDFS上。重点在于logstash的input、filter和output配置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

logstash是什么就不介绍了,具体看代码
1.input为elasticsearch

input {
  elasticsearch {
    hosts => "192.168.1.16:9200"  //这里是你es的IP地址和端口号
    index => "position"      //索引名
    size => 10000      //每次刷入的量
     query => '{"query":{"bool":{"disable_coord":false,"adjust_pure_negative":true,"boost":1}},"_source":{"includes":["_id","ent_status","formatted_address","dom","city","adcode","level","ent_type","city_code","data_date","update_date","pripid","province","entname","district","location"]}}'     //需要查询的条件
    scroll => "5m"
    docinfo => true
  }
}

2.filter对input进来的数据做操作
数据格式如下图
在这里插入图片描述

filter {
//上述中lat和lon是里层的数据,需要对location做处理,新增一个属性,json化一下这样就和外层的数据在一个级别,便于我后期取值
  mutate {
   add_field => {
     "local_value" => "%{location}"
     }
  }
  json {
  source => "local_value"
  remove_field => ["location","local_v
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值