zabbix官网地址: https://www.zabbix.com/cn/download
个人建议哈:不管是啥子服务配置,最好先到官网瞄一眼,看看它的适用场景及配置要求
一、基础原理介绍
Zabbix是一个企业级的开源分布式监控解决方案,由C语言编写而成的底层架构(server端和agent端
C/S(即服务端和客户端模式),通过客户端监控服务器
server 主动找 Agent(代理)要数据,叫agent的被动模式(对server消耗大);每隔一定时间,agent主动把数据推送server端,叫agent的主动模式
被监控的服务器>150台,要调成agent的主动模式,减小对server端的消耗
agent的主动模式
各个idc机房里的被监控服务器-----------------------主动把数据发给idc机房的proxy(分布式客户端)--------保存在本地数据库-------集中把数据推送给zabbix--server(web界面)
agent的被动模式:zabbix_get(server)向agent(zabbix_sender)发送一个代号,agent把数据给server
agent的主动模式:agent监听10050端口 ----------定时向server端(监听10051)发送数据
zabbix主件:
1)zabbix server :负责接收agent发送的报告信息的核心组件,所有配置、统计数据及操作数据都由其组织进行;
2)Database Storage: 存储所有配置信息,以及由zabbix收集的数据;
3)web interface:zabbix的GUI接口,通常和server运行在同一台主机上;
4)proxy:可选主件,常用于分布式监控环境,代理server收集部分被监控端的监控数据并统一给server端;
5)agent:部署在被监控主机上,负责收集本地数据并发给server端或proxy端;
说明:zabbix node 也是zabbix server的一种
进程:
默认情况下zabbix包含5个程序:zabbix_agentd zabbix_get zabbix_proxy zabbix_sender zabbix_server,另外一个zabbix_java_gateway(监听tomcat的)是可选,这个需要另外安装
zabbix监控环境中相关术语:
主机(host):要监控的设备,可有ip或dns名称指定;
主机组(host group)
监控项(item):具体监控啥子指标,如cpu 内存等,只拿数据不做数据分析
触发器(trigger):对拿过来的数据进行判断,不报警
报警媒介类型(media):发通知,如邮件等
动作(action):关联告警和具体的报警媒介的
流程:
先要配置监控项:检测具体的数据信息 (获取信息)
触发器:判断获取的数据是否有效、安全,是否有问题,如果有问题,触发颜色告警
动作:关联告警等级和具体的报警媒介(邮件、电话、微信等)
用户功能模块确定是否接收告警邮件
二、zabbix-server服务端、zabbix-agent客户端安装(这里用单台主机演示流程,后续会写自动化工具ansbile批量安装agent端)
1)环境及准备
2台主机(ip、主机名):
192.168.200.82 zabbix-server
192.168.200.127 zabbix-agent01
关闭防火墙firewalld、selinux、NetworkManager
#系统类型
[root@zabbix-agent01 ~]# cat /etc/redhat-release
CentOS Linux release 7.5.1804 (Core)
#改主机名后在/etc/hosts映射文件设置(server端同理)
[root@zabbix-agent01 ~]# cat /etc/hosts
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 zabbix-agent01
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6 zabbix-agent01
192.168.200.127 zabbix-agent01
#模拟内网环境:注