Hadoop2.x完全分布式环境搭建及测试验证

最新推荐文章于 2023-07-04 20:20:39 发布

原创

最新推荐文章于 2023-07-04 20:20:39 发布 · 462 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#完全分布式

本文详细介绍了如何在三台虚拟机上搭建Hadoop2.x的完全分布式环境，包括操作系统配置、Hadoop安装、配置文件设置、SSH无密登录配置、HDFS和YARN的启动与验证，以及WordCount示例的运行，最后还提供了常见问题的解决方案。

Hadoop2.x完全分布式环境搭建及测试验证

前置条件：

[1] 已制作好CentOS虚拟机模板。

[2] 该模板安装好Oracle JDK，且JAVA_HOME值为/usr/java/jdk1.8.0_171-amd64/jre。

准备三台虚拟机

[1] 搭建完全Hadoop分布式最少需要三台服务器，假设三台服务器的IP地址如下：

192.168.159.194 hadoop01

192.168.159.195 hadoop02

192.168.159.196 hadoop03

[2] 配置要求：建议每台虚拟机的配置最低为2核4G，如果内存确实有限，可以将hadoop02和hadoop03的内存降为2G，但hadoop01的内存不能低于4G，因为根据后面的安排，hadoop01作为主节点，上面部署的服务较多。

概述

完全分布式包含多个节点，按功能可划分为：

[1] 主节点(master)：如NameNode和ResourceManager

[2] 备节点(slave)：如DataNode和NodeManager

[3] 辅助服务：如Web App Proxy Server和MapReduce Job History server

部署架构

配置文件

可分为三类：

[1] 只读的默认配置文件，包括

hadoop-2.7.3/share/doc/hadoop/hadoop-project-dist/hadoop-common/core-default.xml

hadoop-2.7.3/share/doc/hadoop/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml

hadoop-2.7.3/share/doc/hadoop/hadoop-yarn/hadoop-yarn-common/yarn-default.xml

hadoop-2.7.3/share/doc/hadoop/hadoop-mapreduce-client/hadoop-mapreduce-client-core/mapred-default.xml

[2] site相关的配置，包括：

hadoop-2.7.3/etc/hadoop/core-site.xml

hadoop-2.7.3/etc/hadoop/hdfs-site.xml

hadoop-2.7.3/etc/hadoop/yarn-site.xml

hadoop-2.7.3/etc/hadoop/mapred-site.xml

[3] 控制脚本文件，在hadoop-2.7.3/etc/hadoop/*-env.sh

说明：以下操作在hadoop01上进行。

第一步：操作系统配置

[1] 修改/etc/hostname的内容为hadoop01

[2] 修改/etc/hosts的内容为

127.0.0.1 localhost

192.168.159.194 hadoop01

192.168.159.195 hadoop02

192.168.159.196 hadoop03

[3] 重启操作系统

[root@centos7 ~]# init 6

第二步：Hadoop安装包下载

可以在官网https://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/hadoop-2.7.3.tar.gz

第三步：解压hadoop包

[1] 将hadoop-2.7.3.tar.gz上传到/root目录下。

[root@hadoop01 ~]# cd /opt/

[root@hadoop01 opt]# tar zxf ~/hadoop-2.7.3.tar.gz

[root@hadoop01 opt]# cd hadoop-2.7.3/

[2] 创建hadoop需要的目录

[root@hadoop01 ~]# mkdir -p /opt/hadoop-2.7.3/data/namenode

[root@hadoop01 ~]# mkdir -p /opt/hadoop-2.7.3/data/datanode

第四步：配置Hadoop

[1] 配置hadoop-env.sh

编辑etc/hadoop/hadoop-env.sh，修改JAVA_HOME的值如下：

# The java implementation to use.

export JAVA_HOME=/usr/java/jdk1.8.0_171-amd64/jre

[2] 配置core-site.xml

编辑etc/hadoop/core-site.xml，修改如下：

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://hadoop01:9000</value>

</property>

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。