hdfs（一）高可用单NameNode从standby恢复为active

原创

已于 2023-11-08 10:51:26 修改 · 2.3k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#hdfs #大数据 #高可用

于 2023-01-22 16:45:40 首次发布

文章描述了一种情况，即在一个HDFS高可用集群中，一个Namenode的信息丢失，导致集群无法正常工作。解决方法包括重新搭建Namenode节点，导入元数据，更新配置，格式化Zookeeper上的Namenode记录，并启动集群。作者还提出了是否可以从高可用状态降级为单Namenode状态的思考。

1、背景

有一个hdfs高可用集群，因为某些操作，导致其中一个namenode的信息全部丢失了。最后只剩下一个完整的namenode信息和datanode信息。于是在在启动hdfs后发现独有的namenode始终处于standby状态。即使通过hdfs haadmin -transitionToActive命令也不能强制转换namenode为active。因此hdfs一直不能正常对外提供服务。

2、解决思路

高可用hdfs集群，至少要有两个namenode节点，如果只有一个namenode节点，那么无论怎么启动，namenode节点状态始终为standby。所以如果想将hdfs重新恢复可用，那么可以重新搭建一个namenode节点。然后将完整的namenode元数据重新导入到新namenode中。