kernel
kernel相关的指标,Telegraf采集的不太多,相关配置和采集内容如下:
# Get kernel statistics from /proc/stat[[inputs.kernel]]# no configuration# Output:kernel,host=10-255-0-34 boot_time=1624622463i,context_switches=15118293984i,entropy_avail=3117i,interrupts=9688656581i,processes_forked=64968689i 1636203352000000000
保持这个配置不动即可
system
system相关的指标,要指定一下配置,把uptime_format这个field给干掉,这个内容是个字符串,Prom生态不支持,配置如下:
# Read metrics about system load & uptime[[inputs.system]]## Uncomment to remove deprecated metrics.fielddrop = ["uptime_format"]
system相关的指标,会采集load1、load5、load15,有些朋友可能希望这个值除以CPU核数,得到平均每个CPU的负载,在Prom生态也比较简单:
system_load1 / system_n_cpus
processes
processes相关的指标,主要是采集了系统的进程总数情况,有多少僵尸进程、多少running、多少sleeping等,没有

本文探讨了如何通过Telegraf采集kernel统计、system负载及processes状态,包括配置详解,如移除uptime_format字段和设置processes告警阈值。关键词聚焦于系统监控、kernel性能、Prometheus应用和进程管理。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



