hadoop集群启动但不能访问50070

本文解决Hadoop伪集群环境下50070端口无法访问的问题,包括关闭防火墙、调整网络配置等步骤,并提供了解决方案。

http://blog.youkuaiyun.com/gingerredjade/article/details/53364682


最近搭建Hadoop伪集群时 ,HDFS文件系统成功格式化,节点启动了,jps也有显示,但http://IP :50070就是访问不了。

困扰很久发现问题仅仅出现在防火墙没有关闭。。。。。


伪集群搭建采用的是CentOS 7.0,而CentOS7.0默认使用的是firewall作为防火墙,可以改为iptables。

Firewall:

systemctl start firewalld.service#启动firewall

systemctl stop firewalld.service#停止firewall

systemctl disable firewalld.service#禁止firewall开机启动

改成iptables:

systemctl startiptables.service


若操作系统使用的CentOS6.5的话,也需要关闭iptables防火墙

service iptables stop关闭完成,但重启机器就会启动,所以需要用下面命令永久关闭它。

chkconfig iptables off开机就不会启动了。


#############################################

Hadoop启动之后,遇到一个奇怪的问题:

VMware虚拟机中Hadoop服务的端口50070无法访问的问题---通过127.0.0.1:50070、localhost:50070、主机名:50070均可访问,唯独IP:50070不能访问到。

通过查找日志:发现datanode的日志中提示:访问MasterNameNode:8020不能访问。


排查步骤:

1.首先,各个虚拟机和客户端之间都能ping通,虚拟机都能上外网,说明网络没有问题。

2.各个虚拟机自己的防火墙已经关闭。

3.是不是端口有问题呢?通过命令#netstat -tnpl


发现监听都配置在:127.0.0.1,结合可以通过127.0.0.1:50070能够访问考虑,是不是把这个地址改成真实的IP就可以了?

因为所有hadoop内部配置的都是hostname,所以有两种方法:

1.将hadoop中所有的hostname改成IP的方式。

2.修改Linux的设置,将hostname映射地址改为真实的IP。

研究第二种方式,排查发现:hostname -i命令显示的IP为:127.0.0.1  真实IP

所以,在Master中,实验将/etc/hosts中的127.0.0.1一行注释掉,运行发现部分端口已经改正,还有部分端口没有改正过来。

将各个数据节点中/etc/hosts中的127.0.0.1行去掉,重新启动hadoop发现:


通过http://真实IP:50070已经可以进行访问,问题解决。

Hadoop集群中,节点启动正常但无法访问Web界面的情况可能由多种原因导致。以下是一些常见的问题及其解决方案: ### 网络配置问题 确保所有节点之间的网络连接是正常的,并且可以通过主机名或IP地址相互访问。检查`/etc/hosts`文件是否正确配置了集群中所有节点的主机名和IP地址映射。此外,确认防火墙规则允许通过Web服务使用的端口(如9870用于HDFS, 8080用于YARN)。 ### Web服务地址绑定 检查Hadoop配置文件中的Web服务地址是否设置为正确的网络接口。例如,在`hdfs-site.xml`中,`dfs.namenode.http-address`应指向NameNode的IP地址或0.0.0.0以监听所有接口。同样地,在`yarn-site.xml`中,`yarn.resourcemanager.webapp.address`应该被正确配置。 ### 服务状态与日志 尽管节点进程看似正常运行,但仍需检查每个相关服务的日志文件以获取错误信息。对于HDFS,查看NameNode和DataNode的日志;对于YARN,则检查ResourceManager和NodeManager的日志。这些日志通常位于Hadoop安装目录下的`logs/`文件夹内。 ### 浏览器缓存与代理 有时候浏览器缓存或代理设置可能会导致无法加载特定网页。尝试清除浏览器缓存或者禁用代理来排除这个问题。 ### 示例配置检查命令 ```bash # 查看HDFS Web服务配置 cat /opt/softs/hadoop3.1.3/etc/hadoop/hdfs-site.xml | grep dfs.namenode.http-address # 查看YARN Web服务配置 cat /opt/softs/hadoop3.1.3/etc/hadoop/yarn-site.xml | grep yarn.resourcemanager.webapp.address # 检查NameNode日志 tail -n 100 /opt/module/hadoop-2.7.2/logs/hadoop-<username>-namenode-<hostname>.log ``` ### 系统时间同步 确保集群内所有节点的时间保持同步。不同步的时间可能导致认证失败或者其他问题,这可以通过NTP服务实现。 ### DNS解析 如果使用的是主机名而不是IP地址进行访问,请确保DNS能够正确解析这些主机名。可以临时修改本地`C:\Windows\System32\drivers\etc\hosts`文件来添加必要的映射关系。 ### 安全组/云平台设置 如果你的Hadoop集群部署在云平台上,需要检查安全组规则或网络安全ACL,确保外部流量可以到达运行Web服务的端口。 解决此类问题时,通常需要综合考虑以上各个方面,并逐一排查潜在故障点。一旦确定了具体原因,就可以采取相应的措施来修复配置或调整环境设置,从而恢复Web界面的访问能力。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值