一. namenode启动不了
jps查看,发现namenode总是起不来,到${Hadoop-home}/logs目录下查看namenode日志,发现报错:
1.namenode.FSNameSystem Encountered exception loading fsimage
2.Storage directory /tmp/hadoop-hadoop/dfs/name does not exist
3./tmp/hadoop-hadoop/dfs/name is in an inconsistent state : storage directory does not exist or is not accessible
后来发现,在这个目录下的name文件夹在服务器重启或者hadoop服务重启的时候会自动删除,导致namenode节点数据不可访问,需重新配置namenode节点/tmp文件,配置文件在${hadoop-home}/core-site.xml,配置标签值hadoop.tmp.dir
/usr/local/Cellar/hadoop/2.7.3/tmp/hadoop-hadoop
value值自己视情况定
然后hadoop namenode -format
然后重启hadoop服务。
二. jps只有HMaster,没有HRegionServer
这个问题是zookeeper连接不上导致的,我这里用的是HBase自带的zookeeper服务,所以在hbase-site.xml文件里要配置
hbase.cluster.distributed
true
hbase.zookeeper.property.dataDir
/home/hadoop/zk_data
在hbase-env.sh文件里面配置
export HBASE_MANAGES_ZK=true
注意取消注释符号。
至此,hadoop服务和hbase服务可以正常运作了
- 运行hadoop shell命令报call from localhost/127.0.0.1 to master:9000 failed on connection exception
原因:出现这个问题大部分是namenode启动不正常导致,一方面检查{HADOOP_HOME}/etc/hadoop下的core-site.xml文件,是否正确填写了fs.defaultFS的值,我这里的是hdfs://master:9000,再重新format namenode
hdfs namenode -format
重启hdfs和yarn服务
我这边就不再报这个错了,当然每个人可能情况不一样,那就要针对你hadoop集群的配置具体问题具体分析,我这里只给出了一种和我情况一样的解