前言
一个完整的项目的业务架构包括
客户端
-> 防火墙 -> 负载均衡层(四层、七层 LVS/HAProxy/nginx)
-> Web缓存/应用层(nginx、tomcat)
-> 业务逻辑层(php/java动态应用服务)
-> 数据缓存/持久层(redis/mysql)
一个运维架构
运维客户端
-> 跳板机/堡垒机(jumpserver/VPN)
-> 监控系统(zabbix、prometheus)、
日志系统(ELK、Loki)、
存储系统(NFS、Ceph、NAS、SAN)、
自动化运维平台(Ansible)、
自动发布系统(CI/CD jenkins gitlab)
一.监控的概述
作为一个运维,需要会使用监控系统查看服务器系统性能、应用服务状态和网站指标等,利用监控
系统的数据去了解项目上线发布的结果和健康状态;
利用一个优秀的监控软件,我们可以
- 通过一个友好的界面进行浏览整个网站所有的服务器状态
- 可以在 Web 前端方便的查看监控数据
- 可以回溯寻找事故发生时系统的问题和报警情况
1.zabbix 是什么?
(1)zabbix 是一个基于 Web 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决
方案。
(2)zabbix 能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统
管理员快速定位/解决存在的各种问题。
(3)zabbix 由 2 部分构成,zabbix server 与可选组件 zabbix agent。通过 C/S 模式采集数据,
通过 B/S 模式在 Web 端展示和配置。
(4)zabbix server 可以通过 zabbix agent,SNMP协议,端口监视等方法提供对远程服务器/网络
状态的监视,数据收集等功能,它可以运行在 Linux 等平台上。
(5)zabbix agent 需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关
的内存,CPU 等信息的收集。
2.zabbix 监控原理
zabbix agent 安装在被监控的主机上,zabbix agent 负责定期收集客户端本地各项数据,并发送至
zabbix server 端,zabbix server 收到数据后, 将数据存储到数据库中,用户基于 Zabbix Web 可
以看到数据在前端展现图像。当 zabbix 监控某个具体的项目, 该项目会设置一个触发器阈值, 当
被监控的指标超过该触发器设定的阈值,会进行一些必要的动作,动作包括:发送信息(邮件、微
信、短信)、发送命令(shell 命令、reboot、restart、 install 等)。
总结:zabbix agent 等代理端会定期采集被监控主机的指标数据并发送给 zabbix server,zabbix server 接收数据后会存储带 zabbix database 中,管理员可基于 zabbix web 在浏览器页面查看监控数据的图像。
3.Zabbix 6.0 新特性
(1)Zabbix server高可用防止硬件故障或计划维护期的停机:
- 原生选择加入HA群集配置
- 定义一个或多个备用节点
- 实时监控Zabbix server群集节点的状态
- 不需要外部工具即可将Zabbix server配置为HA群集模式
(2)Zabbix 6.0 LTS新增Kubernetes监控功能,可以在Kubernetes系统从多个维度采集指标:
- Kubernetes节点和pods的自动发现和监控
- 无代理方式采集Kubernetes pods和节点的信息
- 获取Kubernetes节点主机高水平信息
4.Zabbix 6.0 功能组件(C/S架构)
服务端
(1)Zabbix Server(端口10051)
zabbix服务端进程,用于接收代理端发来的监控指标数据,配置和管理zabbix应用程序,也是监控系统的告警中心(通过监控项告警触发配置实现)
- zabbix 服务端守护进程,是 Zabbix 软件的核心组件,Zabbix Agent 向其报告可用性、系统完整性信息和统计信息。
- Zabbix Server 也是存储所有配置信息、统计信息和操作信息的核心存储库。
- Zabbix Server 也是 Zabbix 监控系统的告警中心。在监控的系统中出现任何异常,将发出通知给管理员。
基本的 Zabbix Server 的功能分解成为三个不同的组件。他们是:Zabbix server、Web 前端、数据库。
(2)Zabbix 的所有配置信息都存储在 Server 和 Web 前端进行交互的数据库中。例如,当你通过
Web 前端(或者API)新增一个监控项时, 它会被添加到数据库的监控项表里。然后,Zabbix
server 以每分钟一次的频率查询监控项表中的有效项,接着将它存储在 Zabbix server 中的缓存
里。 这就是为什么 Zabbix 前端所做的任何更改需要花费两分钟左右才能显示在最新的数据段的原
因。
【1】数据库(zabbix database)
持久化存储配置信息和监控指标数据(支持mysql postgresql oracle db2 tsdb等)
所有配置信息以及 Zabbix 采集到的数据都被持久存储在数据库中。
可以支持 MySQL、PostgreSQL、Oracle、DB2、TimescaleDB 等多种数据库。
【2】Web 界面
用于zabbix服务端配置管理界面和监控数据的UI界面的展示(支持LAMP/LNMP)
Web 界面是 Zabbix Server 的一部分,用于实现展示和配置的界面。通常(但不一定)和 Zabbix
server 运行在同一台物理机器上。
基于 Apache/Nginx + PHP 实现,早期只支持 LAMP 架构,从 Zabbix5.0 开始支持 LNMP 。
客户代理端
【3】Zabbix Agent(端口10050)
客户端守护进程,部署在被监控目标上,用于主动监控本地资源和应用程序,并将收集的数据发送
给 Zabbix Server。从 Zabbix5.0 开始支技 Zabbix Agent2 。
部署在被监控的主机上,采集监控指标数据,并发送给zabbix server(数据采集支持主动模式和被动模式)
主动模式:zabbix agent 主动向 zabbix server 请求监控项列表,并返回监控项所需要采集的监控指标数据给 zabbix server
被动模式:zabbix agent 被动接收 zabbix server 请求的监控指令,zabbix agent 再返回监控项所需要的监控指标数据给 zabbix server
【4】Zabbix Proxy
zabbix代理端进程,部署在zabbix server与zabbix agent之间,代替zabbix server接收zabbix agent发来的监控指标数据并存储在本地数据库,汇总后再转发给zabbix server, 从而可以分担zabbix server的集中式负载压力
zabbix 分布式代理守护进程,可以代替 Zabbix Server 采集性能和可用性数据。Zabbix Proxy 在
Zabbix 的部署是可选部分。
Zabbix Proxy 的部署可以很好的分担单个 Zabb