
分布式监控平台Centreon最佳实践
文章平均质量分 93
Centreon是一款开源、完全基于Nagios进行二次封装的分布式监控平台,ISO一键安装,全程Web界面管控,无需像原生Nagios那样编写大量配置,监控引擎工作时,不是从数据库读取配置信息,性能远超其它监控平台,其分布式代理Poller端,无需数据库支持。本专栏基于生产环境,非一般模拟搭建可比
4/5$全真龙门
linux硬派运维、针灸师、人居环境规划
展开
-
第14章 Centreon 典型故障处理
我想了一下,PVE上那么多虚拟机,虽然是其它应用,但都没出现问题,而且出问题是Centreon的一个应用cbd而已,与虚拟机本身的关系不大,应该另有原因。虽然日志文件很多,但能查到有用信息的文件是centreon-master.log这个,在个案里边,解决故障的日期是11月25日,因此我就查看文件central-broker-master.log-20201125,如果时间再久远一些,系统会自动把旧文件压缩打包,以.gz的形式结尾。系统重启后,启动的是PHP版本是7.2,而不是刚升级上来的PHP7.3。..原创 2022-08-27 12:23:11 · 378 阅读 · 1 评论 -
第13章 Centreon备份与恢复
官方文档对于备份和恢复,特别是恢复过程,稍显复杂:恢复两个数据库(centreon、centreon_storage)、一大堆配置文件(等)。用简化后的方式进行备份和恢复,效率高而且不容易弄混淆。Centreon Web管理后台关于备份的设定,不知道为啥搞得那么隐秘,不在配置菜单中,而是在参数“Parameters”菜单。...原创 2022-08-16 10:19:13 · 164 阅读 · 0 评论 -
第12章 Centreon 分布式监控
Centreon 分布式监控至少能解决两个大问题:一个是分担中心监控服务器的负荷,以支持更大规模的网络;另一个则是穿越网络边界,监控受保护的内部网络。Centreon分布式监控系统由中央服务器、分布式Poller和被监控端三部分所组成,其中中央服务器自身内置一个Poller。分布式环境中,边缘Poller不包含数据库,Centreon引擎所需加载的监控配置,来自中央服务器的数据库输出。只要Centreon Central管理后台没有更新主机或者服务监控项,分布式Poller就不会打扰中央监控服务器的数据库,原创 2021-08-30 13:02:05 · 278 阅读 · 0 评论 -
第十一章 Centreon 版本升级
Centreon版本升级有两种情况:小版本升级与大版本升级。大版本升级指主版本号不一样,如Centreon 19.04升级到Centreon 21.04;而小版本升级则是主版本号不变,子版本号变化,如Centreon 20.10升级到Centreon 21.04。不论是那种形式的版本升级,如果是生产环境,一定要记得先备份,因为只有备份,才是最有效的后悔药。Centreon小版本升级现有的版本号是Centreon 20.04,需要把它升级到最新稳定版Centreon 21.04。...原创 2021-08-13 13:33:57 · 593 阅读 · 3 评论 -
第十章 Centreon 使用技巧
使用技巧,可以提高效率、获得一些便利。创建Centreon 模板从Centreon Central管理后台,一共可以创建主机模板(Hosts)、服务模板(Services)及联系人模板。创建好模板,然后引用它,能减少操作步骤、大大减少配置文件文本的行数,请看下表的比较,差别一目了然。对于一个规模比较大的受监控网络,通过引用模板好处显而易见。当然,使用模板不是必选项,也不会影响到监控引擎的性能。由于创建主机模板、联系人模板与创建服务模板操作大同小异,因此这里就以创建服务模板为例,其它的模板参照此过程不原创 2021-08-04 12:24:29 · 1061 阅读 · 3 评论 -
第九章 Centreon 日常管理及维护
Centreon的部署及初始化操作,投入生产以后,一般不再轻易推倒重来。大量的时间,将花在日常管理及维护上;管理与维护,是两个不同层面,接下来分别进行说明。Centreon 日常维护维护的主要目的是保证Centreon尽可能可靠地运行。这些工作包括:启停与Centreon相关的各种服务、数据备份、故障排查等。Centreon相关服务的启停以ISO镜像文件进行安装的Centreon系统,所有相关的服务都可以用Centos的服务工具“systemctl”来操作,包括升级后的版本。为了保证系统少受干扰,原创 2021-08-03 10:05:15 · 488 阅读 · 1 评论 -
第八章 玩真的,监控生产环境(三)
监控服务一个在系统上运行着的正常的服务(通常指网络),常常同时存在进程与监听端口,比如apache服务,有进程常驻内存及TCP 80端口监听。也有少数服务没有监听端口,甚至连进程也不存在比如著名的负载均衡服务lvs,它是以内核模块加载的。虽然表现形式各有不同,但只要能有输出,都可以被Centreon无差别的监控。监控负载均衡(Keepalived + haproxy)负载均衡服务,只有进程keepalived、haproxy同时常驻内存,并且TCP 80端口处于监听状态,才算是正常。根据这些条件,编写原创 2021-08-01 09:31:04 · 1781 阅读 · 6 评论 -
第七章 玩真的,监控生产环境(二)
监控主机资源经常关注的主机资源主要有CPU负载、磁盘空间使用率、内存使用率、tcp连接数等,监控主机资源,Centreon主控端不能直接获取到所需的数据,需要在被监控端安装代理,由代理获取信息,并把这些数据传送到Centreon服务器。有两种代理工具可以选择,SNMP及NRPE(Nagios Remote Plugin Executor),在实际场景中,我采用的是NRPE。安装NRPENrpe分服务器端和客户端,服务器端安装在被监控的系统,而客户端则需要安装在Centreon Central(不安装原创 2021-07-28 16:15:26 · 184 阅读 · 1 评论 -
第六章 玩真的,监控生产环境(一)
在第五章部署的Centreon虽然有了监控的功能,但仅仅只能检测远端主机是否存活,还远远不能满足实际工作的需求。因此,要部署一个适用于真实场景的监控平台,还有一些工作要做。根据以往的经验,我们的关注点包含但不限于:(1) 监控范围:主机资源监控、服务监控、逻辑监控;(2) 告警的方式:显示屏、邮件、短信、微信或者钉钉机器人;(3) 账号分配:系统管理员与其它技术人员权限设定;(4) 可用性实现:避免单点故障;(5) 系统备份、恢复及迁移。确定监控范围 主机资源监控:系统负载(执行系统指令to原创 2021-07-28 11:51:20 · 325 阅读 · 1 评论 -
第五章 我们的第一个Centreon监控
作者田逸(vx:formyz,mail:sery@163.com)有了Centreon WEB管理界面,我们再也不需要像原生Nagios那样手动编辑各种文本文件,这些操作,绝大部分可以在浏览器页面进行,非常的直观,而且也能减少手工输入字符的错误。接下来,假定一个场景:一个空白干净的Centreon 监控某个远端主机是否存活。这里,我不按照规矩出牌(即不事先安装基本插件、对管理员账号做修改等),而是在操作中故意遇到障碍,以排除故障作为操作路径,加深大家对Centreon的认识和理解,也许这样,可能对初学者原创 2020-12-11 22:11:50 · 2444 阅读 · 3 评论 -
第四章 更进一步了解Centreon
正确部署Centreon,并且启动各相关服务以后,并不能马上投入使用,还需要对其进行相关的设置,比如数据库的初始化,管理账号的生成等等。Centreon初始化设置浏览器访问地址 http://172.16.98.36/centreon,如果页面不能访问,十有八九是selinux在捣鬼,登录系统修改文件/etc/sysconfig/selinux,把它设置成disabled,重启后生效,再访问Centreon所在系统的ip地址。鼠标点击“Next“按钮,第二个依赖检查,要确保全部正确,才可以继续往下进原创 2021-07-27 10:36:54 · 230 阅读 · 0 评论 -
第三章 安装部署Centreon 20
安装Centreon,可以用物理主机,也可以用虚拟机进行。本人通常习惯在Proxmox VE平台进行安装部署,其目的在于快速迁移或故障恢复。不管是物理主机还是虚拟机安装部署,其过程基本相同。为适用各种使用环境,Centreon 提供两种主要的安装方式:基于ISO镜像文件的便捷安装以及在操作系统之上进行安装。个人推荐,以ISO镜像文件进行安装,是最佳的选择,省时省力又不易出错。安装部署需求根据官方的推荐以及本人实际运用可知,centreon监控平台所需要的资源是比较低的。 当前主流的物理服务器,标配的原创 2021-07-26 20:35:28 · 354 阅读 · 0 评论 -
第二章 认识开源分布式监控平台Centreon
Centreon既是产品名,也是公司名。它完全脱胎于知名的监控软件Nagios,并针对性的开发了自己的引擎及相关组件,并对其进行重新封装,虽然如此,但仍然完全兼容Nagios。有nagios使用经验的系统管理员,对Centreon更是得心应手。Centreon公司位于法国,成立于2005年,为私人控股公司。而Nagios公司位于美国明尼苏达州圣保罗,虽然是开源的,但在目前形势下,用非US的产品,可能风险要小一点吧!Centreon对外提供功能丰富的商业版本,同时也提供开源的免费版本。大概有四个可供用户选原创 2021-07-26 12:07:50 · 893 阅读 · 0 评论 -
第一章 监控那些事
我的监控之旅时光倒回到2004年,在上地环岛的一家做在线教育的公司做linux系统管理员。大概有半个机柜的服务器在亦庄的联通机房托管,全部为1U的设备。时不时去一趟机房做维护,各种证件、证明,登记还挺正规的,个人感觉还是很不错的。突然有一天,所有的服务器都不能访问了,等了好长一段时间,也没有恢复的迹象。打电话给机房,答复说正遭受网络攻击,让等等就好。不确定什么时候恢复,就开几个窗口,用ping 服务器的ip方式进行测试,这应该算是最原始的一种监控手段了。Ping了一整天,也没有恢复。第二天老板让开车去现场原创 2021-07-26 10:53:03 · 433 阅读 · 0 评论