Flume学习笔记 --- Flume数据抽取

本文介绍了Flume在数据抽取中的应用,包括RPC模式、执行命令、网络流、设置多个agent流、合并日志数据和多路复用流程。Flume支持Avro、Thrift、Syslog、Netcat等多种方式从不同源获取数据,并能通过Avro或Thrift进行agent间的事件传递。通过配置,可以实现事件根据特定属性多路复用到不同的通道,以便高效地管理和存储日志数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.Flume支持许多从外部源获取数据的机制。

2.RPC模式 
Flume发行版本包含的Avro客户端可以使用Avro RPC 机制将给定文件发送到Flume Avro源。

$ bin/flume-ng avro-client -H localhost -p 41414 -F /usr/logs/log.10

上面的命令会将/usr/logs/log.10的内容发送到监听该端口的Flume源。

3.执行命令
有一个exec源执行给定的命令并消费输出数据。输出的单条数据即文本后面跟着 \r 或者 \n。

4.网络流
Flume支持以下机制从常用日志流类型中读取数据

  1. Avro
  2. Thrift
  3. Syslog
  4. Netcat

5.设置多个agent流

 

为了跨多个agent或者source,先前agent的sink和source需要是avro类型,sink指向source的主机名(ip)和端口。

6.合并
日志收集中非常常见的是大量日志生成客户端将数据发送到连接存储子系统的少数消费者agent.
从数百个web服务器收集的日志发送给写入HDFS集群的十几个agent。

 </

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

杨鑫newlfe

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值