Hadoop集群已经启动成功了
但是web50070只能看到一个运行的datanode 是slave2的
第一反应 我怀疑是我的hosts文件里面是不是设置错了,然后我进去了slave2查看hosts文件,发现各个节点ip地址是对的,然后又查了master的,也是对的,唯独没查slave1的。
然后我就各种搜索资料 什么删除VERSION文件 重启集群
后来竟然启动集群后datanode都不显示了
排除万难之后 还是只显示一个datanode
万念俱灰之下在slave1 打开了hosts文件
挺好的果然是我自己写错了啊啊啊啊啊啊啊啊
因为用的是网上的平台系统,前几天系统扩容过一次 然后把所有的hosts文件都刷新了,昨天在自己重新配置slave1的时候粗心把slave1对应的ip后面写成了slave2

还导致了今天关闭集群的时候需要输入密码 重新设置了一遍ssh免密登录 ,但是在后来几次登陆的时候
QAQ
一个hosts文件配置错误了!
最新推荐文章于 2025-12-01 17:07:41 发布
本文记录了一次Hadoop集群中datanode显示异常的问题排查过程。作者在集群启动后发现web界面仅显示一个datanode,经过一系列排查,最终定位到hosts文件配置错误,并详细描述了解决步骤。
1521

被折叠的 条评论
为什么被折叠?



