
Flume
大数据面试指南
微信公众号:大数据面试宝典
修改简历,面试辅导,回复666领取面试宝典资料
展开
-
Flume简单案例
1.采集目录到HDFS 采集需求:服务器的某特定目录下,会不断产生新的文件,每当有新文件出现,就需要把文件采集到HDFS中去 根据需求,首先定义以下3大要素 采集源,即source——监控文件目录 : spooldir 下沉目标,即sink——HDFS文件系统 : hdfs sink source和sink之间的传递通道——channel,可用file channel 也可以用内存chann...原创 2019-12-04 21:46:14 · 1674 阅读 · 0 评论 -
Flume安装部署
二、Flume安装部署 Flume的安装非常简单 上传安装包到数据源所在节点上 然后解压 tar -zxvf apache-flume-1.8.0-bin.tar.gz 然后进入flume的目录,修改conf下的flume-env.sh,在里面配JAVA_HOME export JAVA_HOME=/export/servers/apache-flume-1.8.0-bin export P...原创 2019-12-04 21:42:30 · 1730 阅读 · 0 评论 -
Apache Flume简介
1.概述 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的软件。 Flume的核心是把数据从数据源(source)收集过来,再将收集到的数据送到指定的目的地(sink)。为了保证输送的过程一定成功,在送到目的地(sink)之前,会先缓存数据(channel),待数据真正到达目的地(sink)后,flume在删除自己缓存的数据。 Flume支持定制各类数据...原创 2019-12-04 21:37:05 · 1882 阅读 · 0 评论