flume简介

最新推荐文章于 2025-06-25 00:23:38 发布

原创最新推荐文章于 2025-06-25 00:23:38 发布 · 597 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

大数据专栏收录该内容

35 篇文章

订阅专栏

Flume是一款高可用、高可靠、分布式的海量日志采集、聚合和传输的软件。核心由agent组成，包括Source采集源、Sink下沉地及Channel数据传递通道。通过Event进行数据传输，但存在重复采集数据的缺点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

flume概述

flume是一个高可用、高可靠的、分布式的海量日志采集、聚合和传输的软件。
flume的核心是把数据从数据源(source)收集过来，再发送到指定的目的地(sink)。为了保证输送的过程一定成功，在送到目的地(sink)之前，会先缓存数据(channel)，待数据真正到达目的地后，flume再删除自己的缓存的数据。

flume系统的核心角色agent

agent本身是一个Java进程，一般运行在日志收集节点，每个agent都3个组件。
1.Source：采集源，用于和数据源对接，以获取数据。
2.Sink：下沉地，采集数据的传送目的地，用于往下一级agent传输数据或者往最终存储系统长度数据。
3.Channel：agent内部的数据传递通道，用于从source将数据传送到sink。在整个数据的传送的过程中，流动的是event，它是Fiume内部数据传输的最基本单位。

flume的缺点

flume最大的缺点就是没有采集记忆，当flume在运行时，出现错误，必须终止flume才能解决时，在再次启动flume时，他会重新采集数据，会造成数据的重复。

weixin_38613375

博客等级

码龄8年

92
原创

24
点赞

111
收藏

5
粉丝

关注

私信

热门文章

分类专栏

工具类
zookeeper 1篇
定时器 1篇
springboot 12篇
dubbo 2篇
ssm 1篇
es
大数据 35篇
linux 13篇
数据库 9篇
java 35篇
spring 5篇
springmvc 4篇
mybatis 9篇
redis 5篇
nginx 1篇

展开全部收起

上一篇：: spark on yarn

下一篇：: kafka的常用操作

最新评论

nginx配置虚拟主机
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
zookeeper单机版安装
优快云-Ada助手: 你觉得作为云原生开发者必不可缺的云原生技能有哪些？包括掌握和运用 Docker，K8S，基于 Spring Cloud 的微服务架构，低代码应用，全云实践，或者其他方面？
zookeeper集群版配置
优快云-Ada助手: 运维需要具备的核心能力有哪些？
linux常用命令
优快云-Ada助手: 如何重装 Windows 操作系统？
linux下安装mysql-5.7.x
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)使用更多的站内链接；(3)提升标题与正文的相关性。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。