使用AOP + Prometheus + node-exporter + grafana 实现Java系统的接口监控（实操）

韩宏伟

已于 2025-03-14 08:44:42 修改

阅读量508

点赞数 5

分类专栏：教程笔记文章标签： prometheus grafana java

于 2025-03-11 23:17:33 首次发布

本文链接：https://blog.youkuaiyun.com/HHW223/article/details/146191683

版权

本笔记适用于想要搭建业务系统监控能力的工程狮。此笔记适用的架构为单机部署方式，更倾向于一个小demo，本笔记需要用到cocker。请提前准备！！

1.监控的目的以及监控哪些内容？

在平常的业务需求中，我们通常需要一下两个方面的监控来全方位了解我们的系统：

1.1 机器健康度监控

CPU使用率、内存使用率、磁盘IO、网络流量
系统负载（Load Average）
磁盘使用情况
进程存活状态
Docker容器状态（如果使用容器化）
系统日志异常

1.2 业务监控

请求QPS、TPS（吞吐量）
请求响应时间（P99, P95, P50）
HTTP状态码统计
数据库查询耗时
缓存命中率
异常日志（如超时、错误）

2. 我们要用到哪些软件来实现呢？

2.1 Prometheus 主要用来存储和查询监控数据。
2.2 node Exporter 这个主要是用来采集服务器的CPU、内存、磁盘、网络指标等。（值得注意的是他基本不占什么内存）
2.3 grafana 通过可视化的图标来展示服务的运行情况
2.4 Java spring boot + Micrometer 实现业务监控

3. 开始搭建Prometheus + Grafana

3.1 创建docker-compose.yml

在本地创建一个文件夹

mkdir monitoring-demo && cd monitoring-demo

3.2 创建docker-compose.yml

version: '3'
services:
  prometheus:
    image: prom/prometheus
    container_name: prometheus
    volumes:
    - ./prometheus.yml:/etc/prometheus/prometheus.yml
    ports:
      - "9090:9090"

  grafana:
    image: grafana/grafana
    container_name: grafana
    ports:
      - "3000:3000"

  node-exporter:
    image: prom/node-exporter
    container_name: node-exporter
    ports:
      - "9100:9100"

在上面的文件中共创建了三个容器，并为他们开放了不同的端口分别是 9090、3000以及9100 其中node-exporter用来采集docker容器的资源。

volumes:
    - ./prometheus.yml:/etc/prometheus/prometheus.yml

这个主要是用来配置普罗米修斯的采集规则，在docker-compose.yml的平级目录中添加一个新的yml用来进行数据采集。

global:
  scrape_interval: 15s  # 全局抓取间隔

scrape_configs:
  - job_name: 'prometheus' # 监控 Prometheus 自己
    static_configs:
      - targets: ['localhost:9090']
  - job_name: 'node-exporter' # 监控 Node Exporter
    static_configs:
      - targets: ['node-exporter:9100']
  - job_name: 'java-demo-app' # Java 业务系统
    metrics_path: '/actuator/prometheus'
    static_configs:
      - targets: ['host.docker.internal:8080']

3.3 启动docker
完成上面的操作后，就可以通过下面的命令来启动容器了

docker-compose up -d # -d 不展示启动log，在后台启动

启动后：

Prometheus 访问地址：http://localhost:9090

Grafana 访问地址：http://localhost:3000（默认用户 admin/admin） Ps🗡 第一次访问会让你改默认密码

一些知识点🛩 ：

在普罗米修斯中可以通过简单的sql来查询已经上报的数据。可以通过 http://localhost:9090/query 这个路径来查询。如果你想要看到一些数据可以尝试查一下 node_cpu_seconds_total 这个信息，你大概可以看到一堆数据

如果你没看到任何信息或者你想要看普罗米修斯正在从收集哪些应用的信息，可以通过 http://localhost:9090/targets 来进行查看，这里可以看到哪些应用在线或者离线

4. 在Grafana中配置Prometheus数据源

访问Grafana http://localshot:3000

Grafana 左侧菜单 → 齿轮图标（Configuration） → Data Sources

点击 Add data source

选择 Prometheus

填写 URL：http://prometheus:9090 这里为什么写prometheus:9090呢，是以为Grafana 和 Prometheus 在同一个docker网络下，所以可以直呼其名

点击 Save & Test → 显示 Data source is working，表示连接成功！

5. 导入监控面板（Dashboard）

导入现成的服务器监控 Dashboard（Node Exporter）

左侧 → Dashboard（四个方块图标） → Import
输入 Dashboard ID：1860
点击 Load
选择 Prometheus 数据源
点击 Import

效果：马上看到服务器 CPU、内存、磁盘、网络图表！

✅ 到目前为止你所完成事情每个组件的职责和意义

组件	作用	你做了什么
Docker	快速构建环境	装了 Docker，部署了容器
Prometheus	抓取指标，保存数据	配了 prometheus.yml，启动服务
Node Exporter	提供主机指标	启动了 node-exporter，暴露 9100
Grafana	数据展示和分析	配了数据源、导入 Dashboard

6. 启动Java DEMO

创建一个maven项目，pom文件如下

<dependencies>
		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-web</artifactId>
		</dependency>
		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-actuator</artifactId>
		</dependency>
		<dependency>
			<groupId>io.pivotal.spring.cloud</groupId>
			<artifactId>spring-cloud-services-starter-service-registry</artifactId>
		</dependency>

		<dependency>
			<groupId>io.micrometer</groupId>
			<artifactId>micrometer-registry-prometheus</artifactId>
			<scope>runtime</scope>
		</dependency>
		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-test</artifactId>
			<scope>test</scope>
		</dependency>
	</dependencies>

配置application.yml

  spring:
    application:
      name: demo
  server:
    port: 8080
  # 以下内容主要是上报jvm的健康度
  management:
    endpoints:
      web:
        exposure:
          include: health,info,prometheus
    metrics:
      tags:
        application: demo-app

启动Javademo项目，这个Java项目的jvm信息将会被上报给普罗米修斯。
想要看看 jvm GC的情况？可以在仪表盘中导入这个json模板

     {
   
       "annotations": {
   
         "list": []
       },
       "panels": [
         {
   
           "type": "stat",
           "title": "GC 次数 (1m)",
           "datasource": "prometheus-1",
           "targets": [
             {
   
               "expr": "increase(jvm_gc_pause_seconds_count{application=\"demo-app\"}[1m])"