Step1:关闭无状态的服务,比如Yarn;
Step2:逐个重启DN实例;
Step3:逐个重启JournalNode实例;
Step4:观察DN、JournalNode和NN服务都正常的情况下,进行下一步(主要是NN的状态);
Step5:关闭两个NN实例;
Step6:重启NN的Active实例(JournalNode必须全部启动);
Step7:观察启动进行(根据数据量大小时间长度不一,大概需要30分钟)

Step8:等NN Active实例启动OK后,启动NN Backup实例;
Step9:启动Yarn等无状态服务;

本文详细介绍了Hadoop集群中NameNode故障时的迁移步骤,包括关闭无状态服务、逐个重启DN和JournalNode实例、观察服务状态、关闭并重启NN实例等关键操作。
467

被折叠的 条评论
为什么被折叠?



