如果给你一个系统你知道需要监控什么吗？

最新推荐文章于 2025-11-24 16:27:21 发布

原创最新推荐文章于 2025-11-24 16:27:21 发布 · 483 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#服务器 #linux #运维


拨测告警：curl：是否返回200，反之则为异常

系统层面告警：
cpu：使用率告警超过-超过99告警

磁盘：磁盘使用率超过-90告警，或者磁盘下的某个路径（/）超过90

内存：使用率超过-90告警

服务层面告警：
主机进程:主机进程不存在，采集器异常

端口:主机进程端口不存在，

数据库层面的告警：一般都是业务层面：

表空间使用率；每秒事务锁等待次数；表锁数告警；读写iops；每秒查询数
数据库拨测：
select count(*) from rm.SRS_CDP_BIM_ZHJ_MNG where rownum =1

k8集群监控：
网络状态

你是选择Prometheus还是zabbix，又或者是选择其他的呢