大数据技术之Flume第1章 Flume概述

Flume是一款由Cloudera公司开发的分布式、可靠且可用的日志收集系统。它支持简单灵活的架构来高效地收集、聚合和移动大规模的日志数据。本文详细介绍了Flume的概念、核心组件包括Agent、Source、Channel和Sink的工作原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.1 Flume概念

Flume是一种分布式,可靠和可用的服务,用于高效收集,聚合和移动大量日志数据。 它具有基于流数据流的简单灵活的架构。 它具有可靠的可靠性机制和许多故障转移和恢复机制的强大和容错能力。 它使用一个简单的可扩展数据模型,允许在线分析应用程序。 

Flume是Cloudera公司开发的用于实时收集服务器(apache/ngnix等)日志数据的框架,Flume很多时候和storm以及spark streaming等流式处理框架结合使用。

1.2 Flume组成架构

 Agent

具有字节有效载荷和可选的一组字符串属性的数据流的单元。 Flume代理(Agent)是一个(JVM)进程,它承载事件从外部源传递到下一个目标(跳)的组件。 是Flume数据传输的基本单元,以事件的形式将数据从源头送至目的地。
Agent 就是一个java进程,Agent主要有3个部分组成,Source、Channel、Sink。

 

本教程由尚硅谷教育大数据研究院出品,如需转载请注明来源。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值