大数据技术--Flume

Flume(采集行为数据)

1.Flume体系结构在这里插入图片描述

Client生产数据,运行在一个独立的线程。
在这里插入图片描述

Flow:Event从源点到达目的点的迁移的抽象。

Agent:一个独立的Flume进程,包含组件Source、 Channel、 Sink。

Source:数据收集组件。(source从Client收集数据,传递给Channel)

Channel:中转Event的一个临时存储,保存由Source组件传递过来的Event。(Channel连接sources 和 sinks ,这个有点像一个消息队列。)

Sink:从Channel中读取并移除Event, 将Event传递到FlowPipeline中的下一个Agent(如果有的话(Sink从Channel收集数据,运行在一个独立线程。)

在这里插入图片描述

2.Flume事务

在这里插入图片描述

3.Flume使用

1)Source的操作

在这里插入图片描述

绝对路径,inode,偏移量

2)Interceptor(Source和Channel之间)

在这里插入图片描述

3)Channel

Memory Channel(稳定情况下使用)–将 Event 数据存储在内存中。

JDBC Channel(放入同一个JDBC 中)–将 Event 数据存储在持久化存储中,Flume Channel 内置支持 Derby。

File Channel–将 Event 数据存储在磁盘文件中。

Kafka Channel-(直接就不需要sink了)–将 Event 数据存储在 Kafka 中。

4)sink(hdfs)

在这里插入图片描述
在这里插入图片描述

5)flume连接(avro)

在这里插入图片描述

sink端

在这里插入图片描述

source端

在这里插入图片描述

6)故障转移

(多个节点利用优先级接收)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

7)负载均衡

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

4.自定义Interceptor

在这里插入图片描述

$:内部类

在这里插入图片描述

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值