这是系列文章,之前的文章如下:
Telegraf大家有了基本了解了,但是能否用好,未必喽,今天我着重调研了一下Telegraf对CPU、内存、硬盘相关指标的采集,大部分指标还算容易理解,硬盘IO相关的有点麻烦,好,下面开始介绍。
CPU
CPU相关的指标比较简单,配置也比较简单,在inputs.cpu这个section,具体如下:
# Read metrics about cpu usage[[inputs.cpu]]## Whether to report per-cpu stats or notpercpu = true## Whether to report total system cpu stats or nottotalcpu = true## If true, collect raw CPU time metricscollect_cpu_time = false## If true, compute and report the sum of all non-idl

本文详细调研了Telegraf对系统资源监控的配置,包括CPU、内存、硬盘和硬盘IO的指标采集。CPU和内存的配置较为直观,硬盘IO的监控可以通过配置忽略不需要的文件系统类型。对于硬盘使用率和inode剩余量等关键指标进行了说明。此外,介绍了如何通过PromQL计算类似iostat的指标,如IO使用率、队列长度和等待时间。最后,讨论了服务端支持QL能力的重要性。
最低0.47元/天 解锁文章
1852

被折叠的 条评论
为什么被折叠?



