在分布式监控系统中,Node_Exporter 是 Prometheus 生态中不可或缺的一环,用于高效采集服务器各类监控指标。然而,Node_Exporter 默认的采集器(Collector)无法覆盖所有业务场景,因此我们需要进行自定义 Collector 开发。
关联阅读:【prometheus】【Node_export】Node_Exporter 的工作原理与开发秘籍
本文将带你深入了解如何开发一个自定义的 Node_Exporter Collector,实现对 Linux 系统中任务统计数据的采集,包括总任务数、运行任务数、睡眠任务数、中断任务数和僵尸进程数等信息。

📊 一、自定义 Collector 需求分析
在 Linux 系统中,我们可以通过 top 命令获取任务(Tasks)相关统计信息,如:
Tasks: 180 total, 1 running, 179 sleeping, 0 stopped, 0 zombie
我们的目标是:
- 解析该信息并将其转换为 Prometheus 可识别的监控指标。
- 展示各类任务状态的统计数据。
- 支持 Prometheus 自动采集与可视化展示。
🛠️ 二、Collector 开发流程
1. 创建 tasksCollector 结构体
我们首先在 collector 包下新建 tasksInfo.go 文件,并定义一个 tasksCollector 结构体:
type tasksCollector struct {
logger *slog.Logger
}
该结构体包含一个日志记录器,便于调试和信息输出。
2. 实现 Update 方法
Update 方法是自定义 Collector 的核心,实现数据的采集和推送到 Prometheus:
func (c *tasksCollector) Update(ch chan<- prometheus.Metric) error {
var metricType prometheus.ValueType
metricType = prometheus.GaugeValue
output := taskGrep(c.logger)
for _, line := range strings.Split(output, ", ") {
l := strings.Split(line, " ")
if len(l) != 2 {
continue
}
name := strings.TrimSpace(l[1

最低0.47元/天 解锁文章
3万+

被折叠的 条评论
为什么被折叠?



