hadoop2.7.3 集群安装

最新推荐文章于 2022-09-16 22:11:57 发布

君莫笑丶一叶知秋

最新推荐文章于 2022-09-16 22:11:57 发布

阅读量501

点赞数

分类专栏： hadoop 文章标签： hadoop ubuntu virtualbox java 集群

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/u011624972/article/details/56484481

版权

hadoop 专栏收录该内容

0 篇文章

订阅专栏

hadoop2.7.3 完全分布式集群搭建及任务测试

第一步准备工作

准备3台服务器或者虚拟机，为了学习并节省成本，可以使用VirtualBox或者wmware 来创建虚拟机

本人使用的是VirtualBox,系统是ubuntu16.04LTS, jdk1.8.0_112, hadoop2.7.3

https://www.ubuntu.com/download 下载ubuntu16.04TLS

获取 ubuntu-16.04.1-desktop-amd64.iso

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 下载jdk

获取 jdk-8u112-linux-x64.tar.gz

http://hadoop.apache.org/releases.html 下载hadoop

获取 hadoop-2.7.3.tar.gz

https://www.virtualbox.org/wiki/Downloads 下载VirtualBox

根据你电脑的系统下载对应的版本

本人下载的是 VirtualBox_mac_5.0.24.dmg

第二步安装

先在你的本机安装 VirtualBox.安装完后，

1 创建虚拟机

http://jingyan.baidu.com/article/cdddd41c5eea3153ca00e160.html 虚拟机创建教程。

安装时语言最好选用 English 内存大小 1024M

2 在ubuntu安装jdk

将下载好的jdk拖放到ubuntu中或者借用scp工具

在/usr/lib目录下创建jvm目录，然后将jdk1.8.0_112.tar.gz 拷贝到该目录下.

cd /usr/liib

mkdir jam

cd jvm

cp ~/jdk1.8.0_112.tar.gz /usr/lib/jvm/(假设你把jdk1.8.0_112.tar.gz放到了当前用户目录下)

tar -zxvf jdk1.8.0_112.tar.gz

mv jdk.1.8.0_112.tar.gz jdk.1.8.0_112

配置环境变量

sudo vi /etc/bash.bashrc 在文件尾部追加图下的内容

source /etc/bash.bashrc

java -version

3 安装hadoop

如下命令

cd /usr

cp ~/hadoop-2.7.3.tar.gz hadoop-2.7.3.tar.gz

tar -zxvf hadoop-2.7.3.tar.gz

mv hadoop-2.7.3.tar.gz hadoop

设置环境变量

sudo vi /etc/bash.bashrc 在文件尾部追加图下的内容

source /etc/bash.bashrc

hadoop version

修改hadoop的配置文件

cd /usr/hadoop/etc/hadoop

sudo vi hdfs.site.xml

sudo vi core.site.xml

sudo vi yarn.site.xml

sudo cp mapred-site.xml.template mapred-site.xml

sudo vi mapped-site.xml

sudo vi slaves

4 创建用户

sudo add group hadoop

sudo adduser -ingroup hadoop hadoop

输入2次密码

更改/usr/hadoop的拥有者和所属组(这一步很重要)

sudo chgrp -R hadoop /usr/hadoop/

sudo chown -R hadoop /usr/hadoop/

5 安装ssh

sudo apt-get install openssl-server

查看服务是否正确启动 ps -ef | grep ssh

切换用户 hadoop登入

su hadoop

输入密码（步骤4中输入的密码）

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

chmod 0600 ~/.ssh/authorized_keys

然后输入命令 ssh localhost 如果没有提示输入密码则表示成功。

（以上2-5的步骤是在master虚拟机上进行的操作）

6 （上面五个步骤成功后，关闭虚拟机）复制2台slave虚拟机

然后右键ubuntu—》复制 —》完全复制(重新配置网络)

如下面：就有3台虚拟机了

复制完后启动每台虚拟机每台虚拟机用hadoop账号登入

这里我的master是ubuntu, slave1是ubuntu1,slave2是ubuntu2

这个时候需要每一台虚拟机都要修改主机名

sudo vi /etc/hostname

修改完后还要修改hosts文件，在每一台虚拟机的/etc/hosts的文件追加内容；

其中格式为 IP hostname(ip 指的是每台虚拟机的ip hostname 是上一步中修改的名字)

ifconfig 查看当前虚拟机的ip地址

然后在每一台虚拟机输入下面命令，看是否ping的通，ping通了则进行下一步

ping master

ping slave1

ping slave2

然后在检查一下每台虚拟机能否ssh无密码自链接

ssh localhost

如果不行的话，执行下面命令

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

chmod 0600 ~/.ssh/authorized_keys

之后实现master到slave1和slave2的无密码ssh登入操作

下面的步骤是每台slave的操作

scp hadoop@master:~/.ssh/id_rsa.pub ~/.ssh/master_rsa.pub

cat ~/.ssh/master_rsa.pub >> ~/.ssh/authorized_keys

最后在master虚拟机输入命令

ssh slave1

看能否不需要密码连接到slave1

7 启动hadoop

下面的步骤是在master虚拟机上进行的

cd /usr/hadoop

bin/hdsf namenode -format

sbin/start-all.sh

启动完成后分别检查每台虚拟机hadoop是否成功启动

输入命令

jps

浏览器输入

master:8088

master:50070

8 提交mapreduce任务测试

cd /usr/hadoop

bin/hdfs dfs -mkdir -p /user/hadoop

bin/hdfs dfs -mkdir input

bin/hdfs dfs -put *.txt input

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-example-2.7.3.jar wordcount input output

bin/hdfs dfs -cat output

君莫笑丶一叶知秋

博客等级

码龄12年

18
原创

15
点赞

15
收藏

4
粉丝

关注

私信

热门文章

分类专栏

最新评论

intellij idea 生成可执行jar 运行提示没有主清单属性
一颗大大大萝卜呗: 666
intellij idea 生成可执行jar 运行提示没有主清单属性
rs勿忘初心: 厉害了，解决了我的问题
intellij idea 生成可执行jar 运行提示没有主清单属性
微电子学与固体电子学-俞驰: 然后指定META-INF/MANIFEST.MF的路径为src下博主这个路径没法指定啊，Intell ij 不让修改
IDEA maven 下载依赖jar包失败的解决思路
强强小宇宙回复强强小宇宙: 上面写错jar名了，是drools 6.5.0Final
IDEA maven 下载依赖jar包失败的解决思路
强强小宇宙: 改下idea中maven的版本试试，下面是个人经验：最近在试用规则引擎，2016版idea使用Maven3.5，然后从私服上下载drools 6.5.0Fianl时一直下不来jar包，其他文件都有了，然后各种尝试，偶然用idea自带Maven2时就下载下来了，但是改为Maven2后，MavenProject中一串红，各种jar找不到，经查询需要删除.iml等文件，然后果断还原工程文件，重新导入，导入时再将Maven设回Maven3.5，奇迹出现了，全好了，据说是idea的bug，具体什么样子偶就不清楚了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。