
Flume
高达一号
这个作者很懒,什么都没留下…
展开
-
Flume_Flume常用配置1_exec.source_memory.channel_logger.sink
我们假定已经对Flume有一定了解,并且对Flume 的各个组件有一定了解。我们演示一个基本的 source 为 exec源channel 为 memorysink 为 logger 类型的配置示例:我们在解压好的目录下创建 2个子目录 my-conf, my-binmy-conf 存放了 对 agent (source, sink, channel) 的配置my-bin 存放了 agent...原创 2018-05-17 20:04:42 · 1297 阅读 · 2 评论 -
Flume_Flume常用配置2_exec.source_memory.channel_hdfs.sink
以下配置基于版本 apache-flume-1.8.0-bin我们假定已经对Flume有一定了解,并且对Flume 的各个组件有一定了解。我们演示一个基本的 source 为 exec源channel 为 memorysink 为 hdfs类型的配置示例:请确保先安装了HDFS , 并对Hadoop 有一定了解,不懂得请自行百度,或者参看博主的Hadoop 相关搭建的文章。我们在解压好的目录下创...原创 2018-05-17 20:25:19 · 571 阅读 · 0 评论 -
Flume_Flume常用配置3_spooldir.source_memory.channel_hdfs.sink
以下配置基于版本 apache-flume-1.8.0-bin我们假定已经对Flume有一定了解,并且对Flume 的各个组件有一定了解。我们演示一个基本的 source 为 spooldir源channel 为 memorysink 为 hdfs 类型的配置示例:这里我们要对spooldir 源进行简单讲解:spooldir 可以避免 exec 中 利用 tail -f xxx.log 可...原创 2018-05-17 20:42:30 · 1340 阅读 · 0 评论 -
Flume_Flume常用配置4_taildir.source_memory.channel_hdfs.sink
以下配置基于版本 apache-flume-1.8.0-bin我们假定已经对Flume有一定了解,并且对Flume 的各个组件有一定了解。我们演示一个基本的 source 为 taildir源channel 为 memorysink 为 hdfs 类型的配置示例:上一个配置中,我们对spooldir 源进行了简单的讲解,也提出了spooldir 中存在的问题,这一章我们对 1.8新推出的tail...原创 2018-05-17 21:23:41 · 1207 阅读 · 1 评论 -
Flume_Flume常用配置5_header + filter taildir.source_memory.channel_hdfs.sink
以下配置基于版本 apache-flume-1.8.0-bin我们假定已经对Flume有一定了解,并且对Flume 的各个组件有一定了解。我们演示一个基本的 source 为 taildir源channel 为 memorysink 为 hdfs 类型的配置示例:上一个配置中,我们对spooldir 源进行了简单的讲解,也提出了spooldir 中存在的问题,这一章我们对 1.8新推出的tail...原创 2018-05-17 21:34:49 · 1068 阅读 · 0 评论 -
Flume_Flume常用配置6 source:taildir channel:memory sink:kafka
最近,博主研究了一下之前一直想研究的 kafka sink。特此记录一下: 下面讲解一些注意事项: 对于 memory channel 来说 : capacity : 默认值:100 单位: int 含义: 通道内事件的最大数量。 注意: 如果事件之间的大小差别很大,可以使用字节数来进行调整。(以下两项) byteCapacity:...原创 2018-10-17 22:39:16 · 577 阅读 · 0 评论 -
Flume_Flume_flume 简介
本文对 flume 进行一个简单的介绍,后续还会陆续补充。 下面介绍下 flume 中的核心概念: flume-1.0 + , 也就是 我们现在一般都在使用的 flume。 都只有1个核心租组件,也就是 agent 。 其中 Agent 又分为3个模块,source, channel, sink , 而 flume 中主要进行数据的搬运,其搬运...原创 2018-10-17 20:56:46 · 366 阅读 · 0 评论 -
Flume_Flume占CPU资源高问题
原文地址:https://www.jianshu.com/p/0b8c59a1b58b 问题描述 Flume多个配置合并后,发现占用cpu很高,利用top有30-50%的使用率,某几台机器60-100%,有时候还会挂起,挂起的时候,有个专门记录读取文件位置的json文件,都是0,似乎是因为某些原因卡住了。初步猜测是多线程问题引起的,但是没有挂起的时候正常采集的情况占用cpu也很高 ...转载 2018-12-26 12:05:18 · 1374 阅读 · 0 评论