本文将讲解在Ubuntu下安装Hadoop2.7.4。
1. 安装JDK
首先,需要在Ubuntu下安装JDK,此处不做介绍,具体可以参考我的另一篇博客http://blog.youkuaiyun.com/yz930618/article/details/77416132
2.下载Hadoop
Hadoop是Apache旗下的产品,打开Apache官网,下载Hadoop http://101.96.8.165/www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.4/hadoop-2.7.4.tar.gz
3. 打开虚拟机,将压缩包从windows下拖到Linux中
如果不能直接拖的话,那么,你需要安装vmware tools才能实现文件共享。
我直接将压缩包放到了桌面,如下所示。
4. 建立Hadoop安装路径
依次输入 cd /usr , sudo mkdir soft , sudo mkdir hadoop
由于文件我已经建好,所以下图为文件建好后的截图。
5. 解压安装文件
将桌面的Hadoop压缩包解压到刚才建立的安装路径下:
输入: sudo tar zxvf hadoop-2.7.4.tar.gz -C /usr/soft/hadoop
解压完后,可以查看解压后的文件:
6. 配置环境变量
输入:sudo gedit /etc/environment
在文件中加入:
HADOOP_INSTALL=/usr/soft/hadoop/hadoop-2.7.4
PATH中加入":/usr/soft/hadoop/hadoop-2.7.4/bin:/usr/soft/hadoop/hadoop-2.7.4/sbin"
其中,有的人会有疑问,为什么其他人会配置HADOOP_HOME,而我这里确配置的是HADOOP_INSTALL呢?
是因为在bin和sbin中的软件包下,可执行文件会动态的创建HADOOP_HOME环境变量,如果我们手动创建了,会对其产生干扰,所以不推荐配置HADOOP_HOME,而我们为了方便访问Hadoop安装目录,所以我们配置了自己的环境变量HADOOP_INSTALL。
保存退出,然后输入下面的命令来使得刚才的操作立马生效:
source environment
7. 测试环境是否搭建成功
输入:hadoop version ,如果出现下面情况,则说明安装成功。