原因:因为在配置zookeeper的时候,有个文件保存位置的地方忘记配置了,用的是默认的,所以每次在哪儿执行的zkServer.sh 的命令时,就在当前目录生成了zookeeper.out的日志文件,我还很强迫症,,,虽然ha集群已经搭好了,也用了好久,但是我还是想着把zookeeper的配置文件改了。后来ha集群就崩了(一直都是两个standby,没有active)看日志就说是connection refused ,也不具体指出哪儿。
解决过程:我知道肯定是zookeeper的问题,想着,那就算了,我把集群上的zookeeper·都删了,再重装一遍zookeeper·这样总可以了吧。说完就开干,我还很细心的把zookeeper相关的文件删了个干净!!装zookeeper倒是很快,装完我先启动zookeeper,唔。。。没起来,zookeeper日志文件也报connection refused (貌似今天不是适合学习。。。)好吧 我查资料,说要么是防火墙没关要么是服务没起,唔,,我肯定是关了也起了。后来在某篇博客上看见说可能是端口被占用了。想着就试了试,what?真的是被占用(讲真我现在也不知道为啥)。总算把zookeeper起来了,状态也都正常,那我想,我的ha集群总应该好使了吧。我兴高彩烈的试试了试,结果DFSZKFailoverController 起不起来,看日志还说是【connection refused】服气了。我认真思考了一下。好吧。我现在的zookeeper相当于重装的,所以我忘了最重要的一步!!在namenode格式化zookeeper。最后大功告成了。。。。