日志收集器fluentd:配置forward从客户机到收集入库端

转载请声明出处:http://blackwing.iteye.com/blog/2152319

试用了fluentd,挺方便易用,支持直接到hdfs,hbase,mangoDB等,可以跟已有业务结合。
安装fluentd非常简单,官方教材地址:[url]http://docs.fluentd.org/categories/installation[/url]

以下是针对ubuntu 12.04 LTS进行说明:
1.先修改系统环境,例如增加open files数目、修改网络参数等:[url]http://docs.fluentd.org/articles/before-install[/url]

2.根据自己系统版本,直接执行官方写好的一键安装脚本:
curl -L http://toolbelt.treasuredata.com/sh/install-ubuntu-precise-td-agent2.sh | sh


安装好后,个文件路径为:
1)配置文件:/etc/td-agent/td-agent.conf
2)起停脚本:/etc/init.d/td-agent start|stop|restart|status
3)默认log路径:/var/log/td-agent/td-agent.log

应用场景是:收集其他部门某应用的log,发回到本部门服务器,并入库到hdfs。所以需要在某部门服务器上,安装fluentd用于把日志forward到本地服务。

借用官方图解:
[img]http://docs.fluentd.org/images/fluentd_ha.png[/img]

官方的配置可以参考高可用部分的配置:[url]http://docs.fluentd.org/articles/high-availability[/url]

大概配置如下:
forward端的配置:
<source>
type forward
port 24224
</source>

# Log Forwarding
<match testforward.**>
type forward
host 172.19.99.176
flush_interval 10s
</match>


聚集端的配置:
<source>
type forward
port 24224
</source>

<match testforward.*>
type webhdfs
host namenode
port 50070
path /log/%Y%m%d_%H/access.log.${hostname}
flush_interval 10s
</match>



但官方没有详细说明,导致配置后fluentd不能启动,其实原来的td-agent.conf配置文件已经有以下配置:

<source>
type forward
</source>


所以,会有两个forward的source,导致fluentd启动失败,报错说端口24224已经在使用,解决办法是删掉以上默认配置就行。


现在可以测试curl一条信息到forward机器,它就会直接把细心转发到聚集机器,并且自动入库到hdfs。

另外,关于其他日志收集工具,请看董西成的blog:[url]http://dongxicheng.org/search-engine/log-systems/[/url]
最近的三年多时间,随着容器技术的火爆及Kubernetes成为容器编排管理的标准,国内外厂商均已开始了全面拥抱Kubernetes的转型, 无数中小型企业已经落地 Kubernetes,或正走在容器化的道路上 。 第一章介绍docker的前世今生,了 解docker的实现原理,以Django项目为例,教大家如何编写最佳的Dockerfile实现构业务镜像的制作。通过本章的学习,大家会知道docker的概念及基本操作,并学会构建自己的业务镜像,并通过抓包的方式掌握Docker最常用的bridge网络模式的通信。 第二章本章学习kubernetes的架构及工作流程,重点介绍如本章学习kubernetes的架构及工作流程,重点介绍如断的滚动更新,通过服务发现来实现集群内部的服务间访问,并通过ingress- -nginx实现外部使用域名访问集群内部的服务。同时介绍基于EFK如何搭建Kubernetes集群的日志收集系统。学完本章,我们的Django demo项目已经可以运行在k8s集群中,同时我们可以使用域名进行服务的访问。第三章本章基于k8s集群部署gitlab、sonarQube、 Jenkins等工具,并把上述工具集成到Jenkins中,以Django项目为例,通过多分支流水线及Jenkinsfle实现项目代码提交到不同的仓库分支,实现自动代码扫描、单元测试、docker容器构建、k8s服务的自动部署。第四章由于公司内部项目众多,大量的项目使用同一套流程做CICD,那么势必会存在大量的重复代码,因此本章主要通过使用groovy实现Jenkins的sharedL ibrary的开发,以提取项目在CICD实践过程中的公共逻辑,提供一系列的流程的接口供公司内各项目调用,开发完成后,还是以Django的demo项目为例,进行Jenkinsfle的改造,最后仅需通过简单的Jenkinsfle的配置,即可优雅的完成CICD流程的整个过程,此方式已在大型企业内部落地应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值