1. 集群中的某个datanode无法启动。
原因:可能是该节点的clusterId和master上的不一样了,修改clusterId和master一样的就行了。如下:

在core-site.xml中找到配置的hadoop.tmp.dir,往下找/dfs/name/current下有个VERSION文件,打开如下:

对比master上的clusterID,修改为mater上的ID就行了。
2. 格式化hdfs的时候出错
出现了No Route to Host from ***** to****等信息,首先要保证各个节点配置额ssh免密码登录,然后看看是否关闭了某个节点的防火墙,本人遇见过一次,就是某个节点的防火墙忘记了关闭。
3. JAVA_HOME is not set and javacould not be found in PATH.
启动在一台机器上启动其他机器上的zookeeper的时候,出现上面错误,但是单台一个一个启动的时候没有问题,肯定是JAVA_HOME的原因,要在zookeeper的bin目录下面的zkCli.sh文件中加上JAVA_HOME=”**/**/”然后就能启动了
4. 两个namenode都是standby状态,并且没法自动切换。出现Operation category JOURNAL is not suppo

本文总结了在部署Hadoop集群高可用(HA)模式时可能遇到的问题,包括datanode启动失败、hdfs格式化错误、JAVA_HOME未设置、NameNode无法自动切换等,并提供了相应的解决方案,如调整clusterID、确保SSH免密登录、配置Zookeeper地址、设置dfs.ha.automatic-failover.enabled、格式化zkfc、修改dfs.ha.fencing.methods以及解决nodeManager启动问题。
最低0.47元/天 解锁文章
1338

被折叠的 条评论
为什么被折叠?



