Hadoop 跑MapReduce Job 的时候卡主,unhealthy-nodes=1

huo_火力全开

于 2018-11-14 11:53:29 发布

阅读量453

点赞数 1

CC 4.0 BY-SA版权

文章标签： yarn MapReduce

本文链接：https://blog.youkuaiyun.com/huonan_123/article/details/84064154

本文解决了一个常见的Hadoop集群问题：YARN显示UnhealthyNodes=1，导致MRJob无法执行。通过调整yarn-site.xml配置，将磁盘健康检查参数设置为允许0%的最小健康磁盘和100%的最大磁盘利用率，成功恢复了节点健康状态。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

出现跑 MR job的时候卡主,根被就没有执行map 和reduce,修改yarn-site.xml的内存也不管用,查看8088接口,发现yarn的Memory Total =0B,Active Nodes =0,而Unhealthy Nodes =1,字面意思就是存在不健康的节点有一个
而我总共就一个节点,所以yarn不能为mr job分配节点执行任务

怎么会出现这种情况,查了资料,说是磁盘满了,但是删了内容,还是不行.有可能是我删文件删错哪里了
总之最终通过以下办法解决了

在yarn-site.xml添加如下内容

<configuration>    
  <property>
     <name>yarn.nodemanager.disk-health-checker.min-healthy-disks</name>
     <value>0.0</value>
  </property>
  <property>
     <name>yarn.nodemanager.disk-health-checker.max-disk-utilization-per-disk-percentage</name>
     <value>100.0</value>
  </property>
</configuration>

参考:https://stackoverflow.com/questions/29010039/yarn-unhealthy-nodes