版本问题的坑

在半夜调整集群配置后,遇到YARN服务挂起,nodemanager无法启动,错误日志显示null pointer异常。通过查阅资料,发现该问题是由于YARN-2816引起的。解决方案包括参考特定链接的解决步骤,删除namenode下的特定目录以恢复服务正常运行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

半夜手贱,调整了下集群配置,发现yarn挂了,nodemanager一直起不来,查了下log是个null pointer,没看出来撒,结果google到这玩意。

https://issues.apache.org/jira/browse/YARN-2816


然后又看到这个

https://sskaje.me/2014/11/yarn-nodemanager-failed-start/

原来。。。

And, in the start-up message part,

2014-10-30 21:23:07,141 INFO org.apache.hadoop.yarn.server.nodemanager.NodeManager: registered UNIX signal handlers for [TERM, HUP, INT]
2014-10-30 21:23:08,259 INFO org.apache.hadoop.yarn.server.nodemanager.recovery.NMLeveldbStateStoreService: Using state database at /tmp/hadoop-yarn/yarn-nm-recovery/yarn-nm-state for recover
2014-10-30 21:23:08,291 INFO org.apache.hadoop.yarn.server.nodemanager.recovery.NMLeveldbStateStoreService$LeveldbLogger: Recovering log #432
2014-10-30 21:23:08,309 INFO org.apache.hadoop.yarn.server.nodemanager.recovery.NMLeveldbStateStoreService$LeveldbLogger: Delete type=0 #432
 
2014-10-30 21:23:08,309 INFO org.apache.hadoop.yarn.server.nodemanager.recovery.NMLeveldbStateStoreService$LeveldbLogger: Delete type=3 #431
 
2014-10-30 21:23:08,321 INFO org.apache.hadoop.yarn.server.nodemanager.recovery.NMLeveldbStateStoreService: Loaded NM state version info 1.0

The solution is, stop the instance, delete ‘/tmp/hadoop-yarn/’ from local filesystem, start the instance.

将每个namenode下的这个目录都删除后,终于恢复了,可以睡觉了。。。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值