HDFS Namenode HA恢复

背景:HDFS 集群为HA 模式,但Standby NameNode 于2月份停止运行,5月27日凌晨Active NameNode也异常退出,在重启Active NameNode时失败,日志显示合并editlog 过程失败。

在这里插入图片描述
尝试一:将Active NameNode节点上的edit log 手工复制到Standby NameNode,重启Active NameNode,仍然出现相同错误。
尝试二:zookeeper 上清除hadoop-ha 相关信息,也无法解决问题。

尝试三:

分析两个txid: txid 2182632559 和 txid 3626089887
最后一次的fsimage_0000000002182632558 显示合并到txid 位置2182632558,所以启动Active NameNode时,会尝试从txid为2182632559的地方与fsimage进行合并,但此时JournalNode的共享目录下已经没有那些2月份的edit log,只有最近几天的,所以获取到的txid 3626089887与预期不符合,是正常的。(服务器默认保留最近两次的fsimage,启动时与最近一次fsimage进行合并。)

将Active NameNode节点上的edit log 传输到JournalNode的共享目录,并初始化JournalNode。
hdfs namenode -initializeSharedEdits

(初始化后,JournalNode的共享目录中edit log 被删除)

重启Active NameNode,此时可以正常启动,会从本地读取edit log 与同目录下的2月份的fsiamge 进行合并;但是启动Standby NameNode 失败,提示相同错误。

后来操作失误,Active NameNode恢复过程中又退出。

第二次,将Active NameNode节点

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值