
Flume
笔记
不会敲代码的小力
OvO
自己做的一些笔记便于自己回顾
展开
-
案例一 Flume接受telent数据
Flume接受telent数据第一步:开发配置文件第二步:启动配置文件 案例:使用网络telent命令向一台机器发送一些网络数据,然后通过flume采集网络端口数据 第一步:开发配置文件 根据数据采集的需求配置采集方案,描述在配置文件中(文件名可任意自定义) 配置我们的网络收集的配置文件 在flume的conf目录下新建一个配置文件(采集方案) vi /export/servers/apache-flume-1.8.0-bin/conf/netcat-logger.conf # 定义这个agent中原创 2020-09-12 09:42:06 · 322 阅读 · 0 评论 -
Flume安装部署
Flume安装部署上传安装文件并解压 上传安装文件并解压 tar -zxvf apache-flume-1.8.0-bin.tar.gz -C /export/servers/ cd /export/servers/apache-flume-1.8.0-bin//conf cp flume-env.sh.template flume-env.sh vim flume-env.sh export JAVA_HOME=${JAVA_HOME} ...原创 2020-09-11 21:56:24 · 296 阅读 · 0 评论 -
Flume内部模块
Flume内部模块Flume内部模块1.1.2 运行机制1.1.3 Flume采集系统结构图 Flume内部模块 1、Source :与数据源对接,用于数据的收集,采集。 2、Channel: 数据的传输(一个flumeAgent内部) 3、Sink : 负责数据的输出 或 下沉(一个flumeAgent内部) 1.1.2 运行机制 1、Flume分布式系统中最核心的角色是agent,flume采集系统就是由一个个agent所连接起来形成 2、每一个agent相当于一个数据传递员,内部有三个组件:原创 2020-09-11 21:27:51 · 218 阅读 · 0 评论 -
Flume的基本介绍
Flume的基本介绍前言1.1 Flume介绍1.1.1 概述 前言 在一个完整的离线大数据处理系统中,除了hdfs+mapreduce+hive组成分析系统的核心之外,还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统,而这些辅助工具在hadoop生态体系中都有便捷的开源框架,如图所示: 1.1 Flume介绍 1.1.1 概述 Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 Flume可以采集文件,socket数据包、文件、文件夹、kafka等各种形式源数据,又可以原创 2020-09-11 21:11:41 · 130 阅读 · 0 评论