最近结合具体的项目,搭建了Hadoop+Hive,在运行Hive之前要首先搭建好Hadoop,关于Hadoop的搭建有三种模式,在以下的介绍中,我主要的采用的是Hadoop的伪分布安装模式。写下来给各位分享。
准备工作:
以上所有的下载的安装包和解压后文件均在/usr/local/hadoop目录
1、分别ssh到每台服务器上,在root用户下修改hostname
su root
vim /etc/sysconfig/network
如上图所示,HOSTNAME=master
vim /etc/hosts
如上图所示,将localhost.localmain处改成master,遮挡处是IP地址,囧,然后重启服务器
reboot
在master服务器添加每台主机名字和地址的映射
vim /etc/hosts
然后检查ping连接
ping slave1
同理,在其他三台服务器上修改主机名和添加地址映射。
2、分别在每台服务器上建立相应的文件夹,并修改文件夹权限
mkdir /usr/local/hadoop
chmod 777 –R /usr/local/hadoop
3、安装jdk,Hadoop使用环境必须有jdk,每台服务器上都必须安装
首先检查有无jdk:java -version
cd /usr/local/hadoop
http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html
将下载的安装包上传到master上的/usr/local/hadoop文件夹下
tar-zxvf jdk-7u79-linux-x64.tar.gz
配置jdk的环境变量:
vim