本帖最后由 pig2 于 2014-7-16 02:56 编辑 问题导读: 1.什么是flume? 2.如何安装flume? 3.flume的配置文件与其它软件有什么不同? 一、认识flume 1.flume是什么? 这里简单介绍一下,它是Cloudera的一个产品 2.flume是干什么的? 收集日志的 3.flume如何搜集日志? 我们把flume比作情报人员 (1)搜集信息 (2)获取记忆信息 (3)传递报告间谍信息 flume是怎么完成上面三件事情的,三个组件: source: 搜集信息 channel:传递信息 sink:存储信息 上面有点简练,详细可以参考Flume内置channel,source,sink三组件介绍 上面我们认识了,flume。 下面我们来安装flume1.5 二、安装flume1.5 1.下载安装包 (1)官网下载 apache-flume-1.5.0-bin.tar.gz apache-flume-1.5.0-src.tar.gz (2)百度网盘下载 链接: http://pan.baidu.com/s/1dDip8RZ 密码: 268r 我们走到这一步,我们会想到一个问题,我的电脑是32位的,不知道能否安装?如果我的电脑是64位的,能否安装。之前我们装的hadoop就分为32位和64位,想到这个问题是正常的,但是这里不用担心,因为我们下载的是二进制包,也就是说你32位和64位都可以安装。 2.分别解压: 下载之后,我们看到下面两个包: (1)上传Linux 上面两个包,可以下载window,然后通过WinSCP,如果不会 新手指导:使用 WinSCP(下载) 上文件到 Linux图文教程 (2)解压包 解压apache-flume-1.5.0-bin.tar.gz,解压到usr文件夹下面
解压apache-flume-1.5.0-src.tar.gz,解压到usr文件夹下面
(3) src里面文件内容,覆盖解压后bin文件里面的内容
(4)重命名
3.配置环境变量: 配置环境变量生效
3.建立配置文件 这里面的配置文件还是比较特别的,不同于以往我们安装的软件,我们这里可以自己建立配置文件。 首先我们建立一个 example文件
,然后把下面内容,粘帖到里面就可以了,注意不要有乱码,有乱码的话,可以直接创建一个文件,然后上传。方法也有很多,能解决就好。 对于下面红字部分,记得创建文件夹,并且注意他们的权限一致,这个比较简单的,就不在书写了。对于下面的配置项,可以参考flume参考文档,这里面的参数很详细。 agent1表示代理名称 4.启动flume flume-ng agent -n agent1 -c conf -f / usr/flume/conf/example -Dflume.root.logger=DEBUG,console 上面注意红字部分,是我们自己建立的文件,而对于绿色部分,则是输出调试信息,也可以在配置文件中配置。 5.我们启动flume之后 会看到下面信息,并且信息不停的重复。这个其实是在空文件的时候,监控的信息输出。 一旦有文件输入,我们会看到下面信息。 比如我们在监控文件夹下,创建一个test1文件,内容如下 这时候flume监控shell,会有相应的如下下面变化 2014-06-02 12:01:04,066 (pool-6-thread-1) [INFO - org.apache.flume.client.avro.ReliableSpoolingFileEventReader.rollCurrentFile(ReliableSpoolingFileEventReader.java:332)] Preparing to move file /usr/aboutyunlog/test1 to /usr/aboutyunlog/test1.COMPLETED 上传成功之后,我们去hdfs上,查看上传文件: 这样我们做到了flume上传到hadoop2.2。 完毕 |
让你快速认识flume及安装和使用flume1.5传输数据(日志)到hadoop2.2
最新推荐文章于 2024-05-02 12:13:09 发布