HDFS安装和启动出错的修复步骤
问题:
对于HDFS的安装过程中,导致HDFS不能正常启动,表现为 NameNode is not format,或者clusterId不匹配。对于这种情况,随意地格式化NameNode不一定能解决问题,因为NameNode格式化会生成新的clusterId,导致集群中的其他服务器的ID与其不匹配,不能进行连接。
步骤
1.start all journalnode
journalnode 是复制集群之间的通信,必须启动它,保证集群之间的正常交互。
2.stop all datanode
3.stop all namenode
2和3步,在于使DataNode和NameNode停止,以方便后续的删除,和格式化。
4.ssh active
登录到Active NameNode节点。
5.hdfs namenode -foramt YYY
对其进行格式化,有问题就按y,一直按三个yyy。因为集群是依照active NameNode搭建的,需要先启动它,作为基准。
6.start ann
启动Active NameNode节点。
7.snn hdfs namenode -bootstrapStandby
以Standby的形式对Standby NameNode进行格式化,它会通过journalnode 获取Active NameNode的信息,进行同步。
8.start snn
9.rm -rf /data*/block
对集群中所有的DataNode进行删除信息,这样启动之后,它才会根据NameNode,更新自己的信息。
10 start dn