Hadoop HDFS-监控（monitor）

最新推荐文章于 2025-10-20 17:48:47 发布

原创最新推荐文章于 2025-10-20 17:48:47 发布 · 774 阅读

CC 4.0 BY-SA版权

文章标签：

23 篇文章

订阅专栏

作者介绍：简历上没有一个精通的运维工程师。请点击上方的蓝色《运维小路》关注我，下面的思维导图也是预计更新的内容和当前进度(不定时更新)。

中间件，我给它的定义就是为了实现某系业务功能依赖的软件，包括如下部分:

Web服务器

代理服务器

ZooKeeper

Kafka

RabbitMQ

Hadoop HDFS（本章节）

经过前面的介绍，我们对HDFS已经具有基本的操作能力，现在来说说每个中间件都必须要讲解的监控环节。

服务可用性

存储容量

文件系统元数据

查看集群摘要、DN 状态、存储概况。

hdfs dfsadmin -report

下面则是一个单机的数据节点。，如果有多个节点，这里就会显示多个节点。

检查文件系统健康，查找损坏/缺失块。

#当然这里的路径也可以更换为其他的 
hdfs fsck /

2. HDFS Web UI

NameNode UI (默认端口 9870)：
- Overview：集群总览、存储摘要、文件/块统计。
- Datanodes：所有 DN 状态、存储分布、读写流量。
- Snapshots：已创建快照列表。
- Startup Progress：NN 启动阶段耗时分析（排查启动慢）。
- Logs：直接查看 NN 日志。

访问方式：http://<nn-host>:9870/jmx 或 http://<dn-host>:9864/jmx。
关键 MBeans：
- Hadoop:service=NameNode,name=FSNamesystemState：文件系统元数据状态（文件数、块数、缺失块等）。
- Hadoop:service=NameNode,name=NameNodeActivity：RPC 操作统计（Ops, AvgTime, QueueLength）。
- Hadoop:service=NameNode,name=JvmMetrics：JVM 内存、GC、线程。
- Hadoop:service=DataNode,name=FSDatasetState-<uuid>：DN 存储卷状态、容量。
- Hadoop:service=DataNode,name=DataNodeActivity-<uuid>：DN IO 操作统计。

四.接入云原生

#如下这个监控 
https://grafana.com/grafana/dashboards/23175-hdfs-datanode/

运维小路

一个不会开发的运维！一个要学开发的运维！一个学不会开发的运维！欢迎大家骚扰的运维！

关注微信公众号《运维小路》获取更多内容。