【Flume】Flume简单介绍

1. 概述

Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输系统。
Flume可以采集多种数据,如:文件、socket数据包、文件夹、Kafka等,还可以将采集到的数据输出到HDFS、HBase、Hive等多种存储系统。
Flume官网有更详细的介绍。

2. 运行机制

Flume中最核心部分是agent,每个agent都是一个JVM进程。
agent由三个组件组成:
source: 采集组件,用于获取数据;
sink:下沉组件,用于将数据传输至下一级agent或写入存储系统;
channel:传输通道组件,用于将source采集的数据传输至sink;

3. 采集方式

根据实际情况的复杂程度,可以配置多种Flume处理方式:

3.1 单agent

在这里插入图片描述

3.2 agent串联

数据可以由一个agent发往另一个agent,agent位于不同主机时,使用avro类型连接两agent。
在这里插入图片描述

3.3 汇总多个agent

也可以由多个agent采集不同源端数据,汇总至一个agent后写入某个存储系统。
在这里插入图片描述

3.4 发往多目的地

同一份源端数据,可以通过多个agent传输,分别输入不同目的地。
在这里插入图片描述

总结
  1. Flume主要用于海量日志传输,可灵活配置agent实现多种传输方案。
  2. agent三组件: source、sink、channel。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值