搭建hadoop集群(内置资源和踩坑记录)

本文详细记录了在VMware上使用CentOS搭建Hadoop集群的过程,包括虚拟机配置、环境变量设置、Hadoop安装与配置、节点启动及集群验证,解决搭建过程中遇到的常见问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

看着视频还花了我10个小时,从搭建虚拟机开始到集群搭建完,踩了很多坑,来记录一下。

环境:我是在vmware上搭建的虚拟机,虚拟机的版本是:CentOS-6.8-x86_64-bin-DVD1(资源:链接: https://pan.baidu.com/s/1gby4QqbU1z5bLc403FPf-w 提取码: g6t9 );

jdk版本:1.8.0_191(需要的给我留言)

maven版本:3.6.0(需要的给我留言)

hadoop版本:2.6.4(需要的给我留言)

现在开始说搭建了:

1.第一步先搭建虚拟机,这个有很多教程,你们自己找吧。我贴一下我的虚拟机的配置

2.虚拟机搭建好,不要急着去搭建第二个,第三个虚拟机。用root用户登录,修改密码为hadoop(这个方便后面的操作,以免忘记)

创建一个用户,命令:useradd hadoop(新增一个用户) passwd(密码)   密码就给hadoop(因为root的权限最大,容易造成操作失误,比如删除所有。所以我们用别的用户来做,这里就是hadoop这个用户)

3.这个时候,我们要去配3个东西:vi /etc/hosts

这里我配了3个地址,但是你们一开始就配当前虚拟机就可以,至于怎么获取你本机的网段可以看这个

点进去,是这样的

我配置的ip+主机名(这里就是域名)

这个命令是要去配置你本机的ip,网关等。

还有一个等会克隆第二个第三个机器的时候再说。

4.上面的配置配好好,你们就可以测试该虚拟机有没有配置ip和能不能ping通www.baidu.com了。

看到这个就是配置好了。

看到这个就是能ping通了。

5.上面说了那么多,只是为了要使用工具,SecureCRT用ssh连接该虚拟机,这里我就不仔细说怎么连接了。
6.现在要将jdk,maven,hadoop弄到服务器上。

6.1.由于我装的是虚拟机是mini版的,所以不能用-rz的方法上传,所以我用的SecureCRT来连接SFTP,将本地的jdk上传到/usr/local下(jdk,maven,hadoop都是使用这种方式。)

6.2 上传好后,解压到/usr/local文件夹下。(hadoop不是放在这个文件夹下的)

6.3 现在来配置环境变量  vi /etc/profile

配置这个的时候一定要小心,因为配错了,那么所有的命令都执行不了。只能强制修改该文件。(这里也是个坑,我原本这里是配错了。花了我20分钟!!!!)

7.前面说了创建了一个用户叫hadoop,用hadoop账户来连接服务器,mkdir apps(创建一个apps的文件夹,hadoop包就放在这里),用6的方法将hadoop的包上传到apps下,并解压。

8.现在来说最重要的东西了:包路径是这样的:

下面的文件是这样的:这五个红框都是要修改的文件,那么接下来就是修改:这个文件执行一个命令

将名字 mapred-site.xml.template 改为mapred-site.xml

这里配置完后,还要执行一个命令  hadoop namenode -format

然后执行 hadoop-daemon.sh   start namenode (启动namenode节点)

9。打开这个网页:http://你服务器的ip:50070 就能看到hadoop提供给我们看的监测页面

(如果你在浏览器上连接不上,首先确定你服务器和电脑的防火墙都关了,还有要配置你的网络。)

这个要跟你服务器上的ip和网关匹配,才能连上外网。

10.上面的步骤只是完成一个namenode节点,下面我们来完成剩下的两个datanode。

10.1 将你的服务器克隆两个出来。我的服务器起名为:mini1,mini2,mini3。下面就用这个来说了。

10.2 克隆好后,重复上面说的第3条。然后第4条中我说到有个坑,这里要提醒你们,因为是克隆的mini1,所以有个文件中需要修改,不然连不上网

将第一个红框那里注释,第二个红框改为eth0。

10.3 由于是克隆,所以jdk,maven都在机器上了,而且都已经配置好了,无需再进行配置。

10.4 为了方便操作,还是按照上面流程创建hadoop用户。用SecureCRT来操作。

10.5 因为mini2和mini3都是data节点,所以我们在启动的时候就用这个命令 执行 hadoop-daemon.sh   start datanode (启动datanode节点)

11.在刚刚namenode节点启动后,hadoop提供给我们的页面上去找,如果你发现你有2个live node,那就说明你的集群搭建成功。(我在这里,要刷新1-3分钟,才能看到我的datanode以及进去了)(如果还没有看见,那就检查一下是否是防火墙没关)

 

 

总结:如果是命令不生效,那说明是配置文件错了。如果是ping不通或者浏览器打不开,先检查防火墙,再检查ip和网关对不对。如果是权限问题,那就给hadoop配置跟root一样的权限。

 

如果各位有什么问题,可以给我留言。

这一篇花了我快1个小时写完,结果写到一半,电脑死机了,还好csdn有自动保存的功能,不然真的哭了!!!

不过我自己搭建好,再总结好,可以说是非常的开心了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值