监控作为边缘计算基础设施的重要组成部分,是边缘稳定性的基本保障。本文主要介绍火山引擎边缘计算的监控实践,分享火山引擎如何进行监控技术选型以及构建监控服务体系。主要内容如下:
边缘计算监控初衷
基于 Prometheus 的监控系统
落地实践
总结
01 边缘计算监控初衷
监控作为边缘计算基础设施的重要组成部分,是边缘稳定性的基本保障。在面对低时延、高带宽、异构汇聚等特点的边缘环境时,如何更加清晰的展现出边缘集群的运行状态,应对边缘环境复杂多变的线上挑战?为此,火山引擎边缘计算需要构建一套完善的边缘计算监控和服务体系。
02 基于 Prometheus 的监控系统
火山引擎边缘计算采用了云原生架构,而 Prometheus 作为云原生时代的指标监控利器,有其先天的优势。相较于其他监控方案,Prometheus 具有以下优点:
- 原生支持 Kubernetes(以下简称 K8s) 监控,具有 K8s 对象服务发现能力,而且核心组件提供了 Prometheus 的采集接口;
- 基于 HTTP 的 pull 方式采集时序数据,可以满足边缘多集群的监控需求;
- 无依赖存储,支持 local 和 remote 存储模式;
- 提供有数据查询语言 PromQL,用户可以直接通过 PromQL 从 Prometheus 里查询到需要的聚合数据。
- 支持多种多样的图表和界面展示,比如 Grafana 等。
基于 Prometheus 的监控系统的架构如图所示,这里详细分享一下数据源和 Prometheus Server 两部分。

数据源
在监控系统中,数据源部分包含:
-
node-exporter:采集物理节点指标;
-
kube-state-metrics:采集k8s相关指标,包括资源使用情况,以及各种对象的状态信息;
-
cadvisor:采集容器相关指标;
-
apiserver, etcd, scheduler, k8s-lvm,gpu 等核心

本文介绍火山引擎边缘计算的监控实践,包括技术选型、监控架构搭建及具体实施案例。采用Prometheus为核心的监控系统,实现对边缘环境的有效监控。
最低0.47元/天 解锁文章
1078

被折叠的 条评论
为什么被折叠?



