搭建hadoop集群，从安装虚拟机开始直到hadoop成功搭建

司空良

已于 2022-12-29 20:32:36 修改

阅读量3.6k

点赞数 11

分类专栏： hadoop 文章标签： hadoop hdfs linux

于 2022-06-16 18:49:19 首次发布

本文链接：https://blog.youkuaiyun.com/sgsgsgwe/article/details/125321392

版权

hadoop 专栏收录该内容

4 篇文章

订阅专栏

搭建Hadoop集群

一、实验目的与要求

学习和掌握Hadoop的相关应用，首先必须得学会搭建Hadoop集群。本次实验将针对Hadoop集群的搭建内容进行演练。学会虚拟机的安装和克隆，Linux系统的网络配置和SSH配置，Hadoop集群的搭建和配置，Hadoop集群测试，熟悉Hadoop集群基本的操作。

要求：1、认真理解集群搭建过程，通过实践成功搭建Hadoop集群。

2、结合实践内容和教材的相关章节完成实验报告。

二、实验内容

1、虚拟机安装

2、虚拟机克隆

3、Linux系统网络配置

4、SSH服务配置

5、JDK安装

6、Hadoop安装

7、Hadoop集群配置

8、格式化文件系统

9、启动和关闭Hadoop集群

10、通过UI界面查看Hadoop运行状态

三、实验环境

虚拟机软件：VMware Workstation 14

操作系统：Center OS 6.9

终端仿真程序：SecureCRT 8.3

Java版本：jdk 1.8.0_161

Hadoop版本：Hadoop 2.7.4

实验过程记录

虚拟机安装

（1）、简易安装信息

（2）虚拟机的安装命名

（3）处理器的配置

（4）内存大小的配置

（5）网络类型

（6）IO控制器

（7）虚拟磁盘类型

（8）磁盘容量

（9）完成创建

虚拟机克隆

克隆位置

克隆向导

克隆源

克隆类型

新虚拟机名字，完成克隆

Linux系统网络配置

配置主机名

对HOSTNAME选项重新编辑

配置IP映射

选择编辑菜单下的虚拟网络编辑，打开虚拟网络编辑器，选中NAT模式下的VMnet8，单击DHCP设置出现窗口

对hosts进行编辑，进行IP映射

网络参数配置

修改虚拟机网卡配置文件，具体命令如下

网卡配置

修改IP地址文件，设置静态IP，命令如下

IP地址配置

配置效果验证

系统重启，通过ifconfig指令查看IP配置是否生效

检查网络连接是否正常

重命名Centos6默认的yum源文件

创建yum源文件Centos-Base.repo

将官方yum源更改为valut的yum源

SSH服务配置

使用rpm -qa | grep ssh 命令查看当前是否安装ssh服务

使用ps -e | grep sshd 查看ssh服务是否启动

JDK安装

下载jdk安装包并且上传到/export/software/目录下

将安装包解压到/export/servers/目录下，具体指令如下

配置jdk环境变量

使用source /etc/profile，刷新使配置文件生效

jdk环境验证

Hadoop安装

先下载好hadoop安装包，上传到/export/soware/目录

解压

添加hadoop环境变量，随后使用source /etc/profile命令使配置文件生效

可以使用hadoop version查看版本号，演示如下：

Hadoop集群配置

配置hadoop集群主节点

修改hadoop-env.sh文件

修改core-site.xml文件

修改hdfs-site.xml

4）修改mpred-site.xml文件

5）修改yarn-site.xml文件

6）修改slaves文件

将集群主节点的配置文件分发到其他的子节点，具体命令如下：

1)将环境变量发送给其他两台虚拟机

Scp /etc/profile sigen1:/etc/profile

Scp /etc/profile sigen2:/etc/profile

2）将hadoop的安装目录发送到其他俩虚拟机

Scp -r /export/servers/Hadoop-2.7.4 sigen1:/export/servers

Scp -r /export/servers/Hadoop-2.7.4 sigen2:/export/servers

3)使环境配置生效

Source /etc/profile

格式化文件系统

初次启动hdfs集群时必须对主节点进行格式化处理，具体指令如下

Hdfs namenode -format 或者 Hadoop namenode -format

必须出现successfully formatted信息才表示格式化成功

启动和关闭Hadoop集群

单节点逐个启动和关闭

启动namenode进程

启动datenode进程

启动yarn ResourceManger进程

启动yarn nodemanger进程

5）启动SecondaryNameNode

（2）脚本一键启动和关闭

启动hdfs服务进程

启动yarn服务进程

3）通过jps查看进程启动情况

10、通过UI界面查看Hadoop运行状态

（1）yarn的ui

hdfs的ui

五、问题及解决办法

问题一：环境变量配置好后，运行不出想要的结果

解决办法：查询课本发现，在环境变量配置好了之后需要用source刷新一下

六、实验总结

通过本次实验，学习和掌握Hadoop的相关应用，首先必须得学会搭建Hadoop集群。本次实验将针对Hadoop集群的搭建内容进行演练。学会虚拟机的安装和克隆，Linux系统的网络配置和SSH配置，Hadoop集群的搭建和配置，Hadoop集群测试，熟悉Hadoop集群基本的操作，对于hadoop的一些相关操作的运用更加得心应手，同时对于自我独立解决问题的能力得到了提高。