hadoop强制进行Active/Standby切换需要注意的问题

最新推荐文章于 2024-02-28 20:53:29 发布

原创最新推荐文章于 2024-02-28 20:53:29 发布 · 1.1w 阅读

9 ·

CC 4.0 BY-SA版权

HADOOP 专栏收录该内容

81 篇文章

订阅专栏

本文介绍如何在启用ZKFC的Hadoop环境下进行强制切换ResourceManager的主备状态，包括命令使用、潜在风险及解决方案。强制切换主要用于解决资源管理器在正常工作情况下出现的两个standby状态导致的应用报错问题。

NN切换
hdfs haadmin -transitionToActive/transitionToStandby

RM切换
yarn rmadmin -transitionToActive/transitionToStandby

但是，这种方式在启用了ZKFC做自动失效恢复的状态下是不允许修改的，提示信息里只说了可以强制执行，但是没有提供命令，其实强制切换主备命令很简单。加个forcemanual就好了。

强制切换
yarn rmadmin -transitionToActive --forcemanual rm1

但是这样做的后果是，ZKFC将停止工作，你将不会再有自动故障切换的保障，但是有些时候，这是必须的，特别是有时候，Hadoop的RM在ZKFC正常工作的情况下，也会出现两个standby，两个standby的问题就在于诸如Hive和Pig这种东西，会直接报一个什么 Operation category READ is not supported in state standby 什么什么的，甚至你看着明明一个是active，一个是standby，也会报这个错误，这时候就必须手动强制切换了，强制切换完以后，别忘了，重新启动ZKFC就好了。这个强制切换的要求就是用户必须没有任何对元数据的操作，这样才能有效的防止脑裂的发生。应该来说，进入安全模式再切换会比较稳妥一些。

补充: Hadoop ResourceManager的实现不像namenode只能有两个做HA，ResourceManager的HA可以多台。