Ubuntu18.04安装hadoop
系统:Ubuntu18.04
java-verison:1.8
hadoop-version:2.x.x
安装hadoop前必须安装java并配置环境变量,若没进行按照或相关配置请查看:https://blog.youkuaiyun.com/LeeGe666/article/details/106050340
更新源
sudo apt-get update
镜像源我已经改成网易云的了,如果用原本的可能有点慢,自行改成国内镜像源(清华源,阿里云源)。
安装openssh-server
sudo apt-get install openssh-server
登录
ssh localhost
安装hadoop
访问hadoop镜像源网站:http://mirror.bit.edu.cn/apache/hadoop/common/
这里我选择2.7.7,可选其他版本,下载.tar.gz压缩包
下载好的文件将在:~/downloads中
解压到 /usr/local 中
进入local目录:
cd /usr/local
sudo tar -zxf ~/Downloads/hadoop-2.7.7.tar.gz -C /usr/local
讲文件夹名字改为hadoop:
sudo mv ./hadoop-2.7.7/ ./hadoop
讲hadoop文件夹权限赋予hadoop用户:
sudo chown -R hadoop ./hadoop
进入hadoop目录:
cd hadoop
查看hadoop版本,检查是否可用:
./bin/hadoop version
伪分布式配置
进入/usr/local/hadoop/etc/hadoop 目录:
cd hadoop/etc/hadoop
配置两个xml文件:core-site.xml和hdfs-site.xml
编辑第一个文件:
gedit core-site.xml
将空的configuration替换为下面的:
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/usr/local/hadoop/tmp</value>
<description>Abase for other temporary directories.</description>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
编辑第一个文件:
gedit hdfs-site.xml
同意也是替换
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop/tem/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/hadoop/tem/dfs/data</value>
</property>
</configuration>
回到hadoop目录:
cd /usr/local/hadoop
执行NameNode格式化:
./bin/hdfs namenode -format
显示成功格式化即可。
开启NameNodetaNode守护进程:
./sbin/start-dfs.sh
查看hadoop运行情况
终端输入:
jps
如下即说明启动成功,hadoop也安装成功。