NN切换
hdfs haadmin -transitionToActive/transitionToStandby
RM切换
yarn rmadmin -transitionToActive/transitionToStandby
但是,这种方式在启用了ZKFC做自动失效恢复的状态下是不允许修改的,提示信息里只说了可以强制执行,但是没有提供命令,其实强制切换主备命令很简单。加个forcemanual就好了。
强制切换
yarn rmadmin -transitionToActive --forcemanual rm1
但是这样做的后果是,ZKFC将停止工作,你将不会再有自动故障切换的保障,但是有些时候,这是必须的,特别是有时候,Hadoop的RM在ZKFC正常工作的情况下,也会出现两个standby,两个standby的问题就在于诸如Hive和Pig这种东西,会直接报一个什么 Operation category READ is not supported in state standby 什么什么的,甚至你看着明明一个是active,一个是standby,也会报这个错误,这时候就必须手动强制切换了,强制切换完以后,别忘了,重新启动ZKFC就好了。这个强制切换的要求就是用户必须没有任何对元数据的操作,这样才能有效的防止脑裂的发生。应该来说,进入安全模式再切换会比较稳妥一些。
补充: Hadoop ResourceManager的实现不像namenode只能有两个做HA,ResourceManager的HA可以多台。
hdfs haadmin -transitionToActive/transitionToStandby
RM切换
yarn rmadmin -transitionToActive/transitionToStandby
但是,这种方式在启用了ZKFC做自动失效恢复的状态下是不允许修改的,提示信息里只说了可以强制执行,但是没有提供命令,其实强制切换主备命令很简单。加个forcemanual就好了。
强制切换
yarn rmadmin -transitionToActive --forcemanual rm1
但是这样做的后果是,ZKFC将停止工作,你将不会再有自动故障切换的保障,但是有些时候,这是必须的,特别是有时候,Hadoop的RM在ZKFC正常工作的情况下,也会出现两个standby,两个standby的问题就在于诸如Hive和Pig这种东西,会直接报一个什么 Operation category READ is not supported in state standby 什么什么的,甚至你看着明明一个是active,一个是standby,也会报这个错误,这时候就必须手动强制切换了,强制切换完以后,别忘了,重新启动ZKFC就好了。这个强制切换的要求就是用户必须没有任何对元数据的操作,这样才能有效的防止脑裂的发生。应该来说,进入安全模式再切换会比较稳妥一些。
补充: Hadoop ResourceManager的实现不像namenode只能有两个做HA,ResourceManager的HA可以多台。
本文介绍如何在启用ZKFC的Hadoop环境下进行强制切换ResourceManager的主备状态,包括命令使用、潜在风险及解决方案。强制切换主要用于解决资源管理器在正常工作情况下出现的两个standby状态导致的应用报错问题。
2789

被折叠的 条评论
为什么被折叠?



