Telegraf监控客户端调研笔记（2）-CPU、MEM、DISK、IO相关指标采集

原创

已于 2022-05-04 22:14:51 修改 · 4.3k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#云原生

于 2022-05-04 22:14:21 首次发布

本文详细调研了Telegraf对系统资源监控的配置，包括CPU、内存、硬盘和硬盘IO的指标采集。CPU和内存的配置较为直观，硬盘IO的监控可以通过配置忽略不需要的文件系统类型。对于硬盘使用率和inode剩余量等关键指标进行了说明。此外，介绍了如何通过PromQL计算类似iostat的指标，如IO使用率、队列长度和等待时间。最后，讨论了服务端支持QL能力的重要性。

这是系列文章，之前的文章如下：

Telegraf监控客户端调研笔记（1）-介绍、安装、初步测试

Telegraf大家有了基本了解了，但是能否用好，未必喽，今天我着重调研了一下Telegraf对CPU、内存、硬盘相关指标的采集，大部分指标还算容易理解，硬盘IO相关的有点麻烦，好，下面开始介绍。

CPU

CPU相关的指标比较简单，配置也比较简单，在inputs.cpu这个section，具体如下：

# Read metrics about cpu usage[[inputs.cpu]]  ## Whether to report per-cpu stats or not  percpu = true  ## Whether to report total system cpu stats or not  totalcpu = true  ## If true, collect raw CPU time metrics  collect_cpu_time = false  ## If true, compute and report the sum of all non-idl