运维监控体系概述

运维监控是确保线上系统稳定的关键,涉及人员、硬件、软件的实时状态监测。监控包括人员的身份验证、硬件的温度湿度、网络配置、系统资源、安全记录等。实施监控可通过开源工具、综合项目或产品化组件,如zabbix。SLA是服务等级协议,确保服务性能和可靠性,通常包含带宽、停机时间等指标。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

运维监控的重要性:==========================

运维工作中比较重要的一个部分,可以说,一切线上系统都需要 监控。

考虑几个话题:

1、什么是监控? ============================

一种实时获取某种对象的 状态、信息 的手段。
人类社会中,监控无处不在。 手段各式各样。

在我们的运维工作中,监控的主要对象是 和企业 业务相关的各种 服务器硬件状态,服务运行状态,员工操作记录等。

人员 硬件 软件

2、为什么要监控? ===========================

没有绝对稳定的系统,我们假定问题一定会出现, 监控是 为了能够及时的发现,并及时的处理问题。

监控、阀值、响应动作、报警方式 、报表/图表

3、 具体监控什么? ===========================

可以说,任何线上的内容,其范围包括: 服务,网络,硬件,系统,人员,甚至 命令执行记录

人员方面:身份验证,机房进出记录,操作记录,甚至在班期间与外界通信记录等。

硬件方面:机房巡检(物理设备): 网线,温度,湿度,磁盘灯,标签, 远程控制卡(独立于主机,能实现开关机,运行记录)

网络方面:路由、交换机的 配置,网络拥塞程度,硬件防火墙配置

系统方面:进程数量,端口数量,用户数量,登录日志,CPU状态,内存状态,磁盘IO,网络IO,磁盘空间用量,敏感/机密文件,新增文件。等

安全方面:出入记录,登录时间,登录来源,操作者,操作细节等

4、 如何来实施监控? ===========================

众多开源小工具(只针对某种对象)
一些相对综合的项目(同时集成各个对象的监控)
某些开源组件 自带的 状态显示功能 (例如 Nginx 的 status 模块)
成熟,产品化的开源组件 (nagios、cacti、zabbix )
商业软件 (博睿/听云,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值