在多台阿里云服务器上部署Hadoop分布式系统及WordCount实验

本文详细介绍了如何在多台阿里云服务器上部署Hadoop分布式系统,包括设置无密码连接、关闭防火墙、安装JDK、配置hostname及hosts、安装Hadoop、启动服务以及进行WordCount测试。通过这些步骤,成功实现了Hadoop集群的搭建和功能验证。

一、实现master与slave之间无密码连接
分别在master及slave上生成rsa密钥:

mkdir ~/.ssh
cd ~/.ssh
ssh-keygen -t -rsa

一路回车(选择默认设置),此时,ssh文件夹中生成了id_rsa.pub和id_rsa两个,然后使用scp命令将公钥(id_rsa.pub)分别拷到对方机器中

scp id_rsa.pub h1@对方机器IP:~/.ssh/authorized_keys

并设置权限:

chmod 700 authoized_keys
chomd 777 ~/.ssh

使用cat命令实现无密码访问自身(localhost)cat id_rsa.pub >> authorized_keys
二:关闭防火墙

sudo ufw disable

三:添加防火墙规则
因阿里云服务器原只支持22、80和443端口,所以需要到控制台中添加防火墙规则,使其支持9000端口等(选择全部TCP+UDP)。
四:安装JDK
到官网下载JDK tar包,本次实验下载的JDK1.8.0版本,在h1用户下新建/usr/java文件夹,并将下载的压缩包解压到java文件夹中:tar -zvxf jdk-8u191-linux-x64.tar.gz然后打开etc/profile 进行环境变量配置:

export JAVA_HOME=/usr/java/jdk1.8.0_191
export JRE_HOME=/usr/java/jdk1.8.0_191/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$JAVA_HOME:$PATH

保存退出,使用source 命令或者重启sudo shutdown -r now使配置生效。可以使用which java测试java是否配置成功。
五:修改hostname及hosts
修改/etc/hostname,master机器上改为master,slave1机器上改为slave1。
修改/etc/hosts,/etc/hosts中原来的内容全部删除,然后加入namenode和datanode的IP以及名字;master中的hosts中的masterIP为master本机内网IP,其他slave节点IP为外网IP;相同的,slave中的hosts中的本机IP必为本机内网IP,其他节点为外网IP。
六:安装Hadoop
到官网下载Hadoop压缩包,本次下载的版本为2.9.1,在h1用户下新建文件夹/hadoop,并将下载好的压缩包解压缩到hadoop文件夹中tar -zvxf hadoop-2.9.1.tar.gz。
在hadoop目录下新建hdfs文件夹,并在hdfs文件夹中新建name、data、tmp三个文件夹。
进入hadoop目录下的hadoop/etc/hadoop文件夹中对hadoop配置

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值