大数据之_数据采集Flume_架构---Flume工作笔记004

本文介绍了Flume的基础架构,包括source、channel和sink的角色。source作为数据源,如日志文件或端口数据;channel作为缓冲区,解决数据产生与消费速度不匹配的问题;sink负责将数据存储到如HDFS的系统中。Flume架构允许根据不同业务类型将数据分发到不同的存储路径。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

然后我们来看flume的基础架构

可以看到,其实就是,web server等产生了日志数据,比如一个日志文件,然后

这个日志文件,会被作为source数据源,这个数据源是一个日志文件,也可以是一个端口数据,

然后source数据源的数据,会走到channel,通过这个通道,传输,然后最终走到,sink中去.

sink(下沉)的作用就是把数据,存储到不同的存储系统中,比如HDFS中.

 

我们来看各个组件的内容,首先agent.

source channel sink

 

source数据源,可以看到netcat,我们知道是端口数据,然后spooling directory,taildir...这种是

文件数据.

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

添柴程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值