Flume*
1.数据流模式:source—channel(可以缓存)—sink
2.事务机制:支持重读重写
3.agent:jvm的运行单元,将外部数据送到目的地,内涵一个数据流,以event作为数据单元进行传输
4.1个souece对应多个channel,1channel对应1个sink
5.flume单层架构(数据暴露,安全性差,产生许多小文件),多层架构(安全但是复杂)
Hadoop Flume 常见问题 【一】
于 2019-06-14 11:11:30 首次发布
本文深入探讨Flume的数据流模式,包括source-channel-sink架构,事务机制支持,以及agent作为JVM运行单元如何处理数据流。同时,分析了Flume的单层与多层架构特点,帮助读者理解其在数据收集场景中的应用。
1477

被折叠的 条评论
为什么被折叠?



