目前覆盖的监控对象包含主机层、组件层、服务拨测,对于无法开箱即用的监控对象可以使用脚本采集、日志采集以及组件二次开发,通过仪表盘实现自定义可视化视图呈现,基于iPaaS的产品设计(关联CMDB、作业执行、数据平台等)天然打破"竖井式"产品设计理念,依托于故障自愈实现告警的无人值守!
主机监控
支持以主机为单元的基础性能指标查看、告警策略配置、告警记录等功能。指标支持CPU、内存、磁盘、网络、进程、系统、事件(corefile、主机重启等)等7类共30~40项指标。
指标定义
指标 | 类型 | 单位 | 含义 | 采集方法(Linux) | 采集方法(Windows) | |||
---|---|---|---|---|---|---|---|---|
5分钟平均负载 | CPU | % | 五分钟内同时处于就绪状态的平均进程数 | awk '{print $2}' /proc/loadavg | N/A | |||
cpu总使用率 | CPU | % | 当前消耗的总CPU百分比 | delta(busy) / delta(total) * 100 busy = user + sys + nice + iowait + irq + softirq + steal + guest + guestnice + stolen total = busy + idle | for /f "tokens=1,2,* delims==" %i in ('wmic path Win32_PerfFormattedData_Counters_ProcessorInformation where "Name='_Total'" get PercentIdleTime/value \ | findstr PercentIdleTime') do (set /a 100-%j) | ||
cpu单核使用率 | CPU | % | 当前单个CPU消耗的百分比 | delta(busy) / delta(total) * 100 busy = user + sys + nice + iowait + irq + softirq + steal + guest + guestnice + stolen total = busy + idle | for /f "tokens=1,2,* delims==" %i in ('wmic path Win32_PerfFormattedData_Counters_ProcessorInformation where "not name like '%Total%'" get PercentIdleTime/value \ | findstr PercentIdleTime') do (set /a 100-%j) | ||
接收字节流量 | 网络 | KB/s | 网卡每秒接收的比特数,即网卡的上行带宽 | 读取/proc/net/dev文件 第1项SpeedRecv = delta(new.BytesRecv, old.BytesRecv) / interval | wmic path Win32_PerfRawData_Tcpip_NetworkInterface get BytesReceivedPersec/value \ | findstr BytesReceivedPersec | ||
发送字节流量 | 网络 | KB/s | 网卡每秒发送的比特数,即网卡的下行带宽 | 读取/proc/net/dev文件第9项SpeedSent = delta(new.BytesSent, old.BytesSent) / interval | wmic path Win32_PerfRawData_Tcpip_NetworkInterface get BytesSentPersec/value \ | findstr BytesSentPersec | ||
发送包速率 | 网络 | 个/s | 网卡每秒接收的数据包数 | 读取/proc/net/dev文件 第10项 SpeedPacketsSent = (counterDiff(once.Stat[i].PacketsSent, val.PacketsSent, NetCoutnerMaxSize)) / interval | wmic path Win32_PerfRawData_Tcpip_NetworkInterface get PacketsSentPersec/value \ | findstr PacketsSentPersec | ||
接收包速率 | 网络 | 个/s | 网卡每秒发送的数据包数 | 读取/proc/net/dev文件 第2项 SpeedPacketsRecv = delta(new.PacketsRecv, old.PacketsRecv) / interval | wmic path Win32_PerfRawData_Tcpip_NetworkInterface get PacketsReceivedPersec/value | findstr PacketsReceivedPersec | |||
established连接数 | 网络 | 个 | 当前服务器下TCP链接处于ESTABLISHED状态的连接数 | 系统netlink实现 验证方法netstat -pant\ | grep |