Flume架构介绍

Flume是一个分布式日志收集系统,它通过source、channel和sink三部分组成,从数据源收集数据并存储到目的地。Event是Flume传输数据的基本单位,包含header和body。Flume架构分为agent、collector和storage,支持多级agent串联,实现扇入和扇出功能,广泛应用于日志采集,可配置多种source、channel和sink类型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Flume架构介绍

  1. Flume概念

    ​ 分布式的日志收集系统,将服务器中的数据收集起来送到指定的地方去,比如说hdfs

    这里写图片描述

  2. Event概念

    ​ flume的核心是把数据从数据源(source)收集过来,再将收集到的数据送到指定的目的地(sink)。为了保证输送的过程一定成功,在送到目的地(sink)之前,会先缓存数据(channel),待数据真正到达目的地(sink)后,flume再删除自己缓存的数据。

    ​ 在整个数据的传输的过程中,流动的是event,即事务保证是在event级别进行的。那么什么是event呢?—–event将传输的数据进行封装,是flume传输数据的基本单位,如果是文本文件,通常是一行记录。event也是事务的基本单位。event从source,流向channel,再到sink,本身为一个字节数组,并可携带headers(头信息)信息。event代表着一个数据的最小完整单元,从外部数据源来,向外部的目的地去。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值