Hadoop+HBase+ZooKeeper分布式集群环境搭建
概述
本次 Hadoop 集群安装实验,采用在 VMware 虚拟机下安装多个 CentOS 系统的
方式进行;3 个 CentOS 系统中,其中,1 个为 Master 机,作为 NameNode;另外 3
个为 Slave 机,作为 DataNode,均采用独立静态 IP 地址配置。
1. 安装准备
1.1 软件系统清单
序号 | 名称 | 描述 |
1 |
| 所有环境都需要的配置 地址 |
2 |
| 虚拟机安装程序,这里采用 VMware12 模拟测试 地址 |
3 |
| 集群操作系统 地址 |
4 |
| Hadoop 安装程序 地址 |
5 |
| HBase 安装程序 地址 |
6 |
| 集群分布式应用程序协调服务 地址 |
以下是hbase官网提供的Hbase和Hadoop版本兼容信息 参考
- “S” = supported(支持)
- “X” = not supported(不支持)
- “NT” = Not tested(未测试)
HBase-1.2.x | HBase-1.3.x | HBase-1.5.x | HBase-2.0.x | HBase-2.1.x | |
Hadoop-2.4.x | S | S | X | X | X |
Hadoop-2.5.x | S | S | X | X | X |
Hadoop-2.6.0 | X | X | X | X | X |
Hadoop-2.6.1+ | S | S | X | S | X |
Hadoop-2.7.0 | X | X | X | X | X |
Hadoop-2.7.1+ | S | S | S | S | S |
Hadoop-2.8.[0-1] | X | X | X | X | X |
Hadoop-2.8.2 | NT | NT | NT | NT | NT |
Hadoop-2.8.3+ | NT | NT | NT | S | S |
Hadoop-2.9.0 | X | X | X | X | X |
Hadoop-2.9.1+ | NT | NT | NT | NT | NT |
Hadoop-3.0.x | X | X | X | X | X |
Hadoop-3.1.0 | X | X | X | X | X |
1.2 IP 地址配置清单
集群环境至少需要3个节点(也就是3台服务器设备):1个Master,2个Slave,节点之间局域网连接,可以相互ping通,下面举例说明,配置节点IP分配如下:
Hostname | IP | User | Password |
master | 192.168.1.60 | root | root |
weiqi1 | 192.168.1.61 | root | root |
weiqi2 | 192.168.1.62 | root | root |
三个节点均使用CentOS-7
系统,为了便于维护,集群环境配置项最好使用相同用户名、用户密码、相同hadoop、hbase、zookeeper目录结构。
2. 准备工作
2.1 关闭防火墙
关闭firewalld
防火墙:
关闭iptables
防火墙:
2.2 安装JDK
上传jdk-8u171-linux-i586.tar.gz
安装包到根目录下新建的weiqi
文件夹中,
进去到weiqi
目录下,解压安装包:
配置java环境变量,打开/etc/profile
文件
添加如下配置:
然后重新加载配置文件使之生效:
检查java环境是否配置成功:
看到如下响应说明环境OK:
2.3 添加Hosts映射关系
分别在三个节点上修改hosts
映射关系:
添加的内容如下:
2.4 集群之间SSH无密码登陆
CentOS默认安装了ssh,如果没有你需要先安装ssh 。
集群环境的使用必须通过ssh无密码登陆来执行,本机登陆本机必须无密码登陆,主机与从机之间必须可以双向无密码登陆,从机与从机之间无限制。
主要有三步:①生成公钥和私钥、②导入公钥到认证文件、③更改权限
分别在各个主机上生成密钥:
在weiqi1上:
在weiqi2上:
在master 上:
测试:
可通过exit
退回到master上
3. Hadoop集群安装配置
3.1 安装置配置Hadoop
3.1.1 安装Hadoop
上传hadoop-2.8.3.tar.gz
安装包到weiqi
文件夹下
解压安装包:
进入到hadoop-2.8.3
下:
分别创建如下相关文件:
进入到etc/hadoop
目录下,分别修改如下配置文件
3.1.2 配置core-site.xml
nano core-site.xml
3.1.3 配置hadoop-env.sh
$ nano hadoop-env.sh
3.1.4 配置hdfs-site.xml
$ nano hdfs-site.xml
3.1.5 配置mapred-site.xml
$ nano mapred-site.xml
3.1.6 配置yarn-env.sh
$ nano yarn-env.sh
3.1.7 配置yarn-site.xml
$ nano yarn-site.xml
3.1.8 配置 slaves
$ nano slaves
3.2 部署他其他节点
3.3 分别配置Hadoop环境变量
$ nano /etc/profile
添加:
然后重新加载配置文件使之生效:
3.4 格式化namenode
进入master,格式化namenode,第一次启动服务前执行的操作,以后不需要执行。
如出现包含以下结果,说明格式化成功了:
同时,也能在master的/weiqi/hadoop-2.8.3/hdfs/name
生成了current
文件夹
3.5 启动Hadoop
进入master
3.6 启动成功标志
在master上使用jps命令:
$ jps
在weiqi1和weiqi2上使用jps命令
$ jps
同时也能在浏览器上通过http://192.168.1.60:50070
web端查看Hadoop信息
或者通过http://192.168.1.60:8088
web端查看Hadoop信息
3.7 关闭Hadoop
关闭 master
节点上的 hadoop
4. ZooKeeper集群安装配置
4.1 安装配置 Zookeeper
上传zookeeper-3.4.12.tar.gz
安装包到weiqi
文件夹下
解压安装包:
进入到zookeeper-3.4.12
下:
分别创建如下相关文件:
进入到conf
目录下,复制zoo_sample.cfg
为zoo.cfg
:
在zoo.cfg
文件下修改添加如下配置:
4.2 部署其他节点
分别复制zookeeper-3.4.12
到其他节点下:
分别配置每台主机的zookeeper
环境变量:
添加:
然后重新加载配置文件使之生效:
分别在每台主机的/weiqi/zookeeper-3.4.12/data
目录下创建myid
文件,同时和zoo.cfg
文件中的server
对应,master
的myid
中填0
、weiqi1
的myid
填1
、weiqi2
的myid
填2
,
如下:
master
下:
weiqi1
下:
weiqi2
下:
4.3 启动ZooKeeper集群
在ZooKeeper集群的每个节点上,执行启动ZooKeeper服务的脚本:
查看服务是否启动成功:
成功状态如下:
貌似leader
节点是随机分配的:
follower
4.4 启动成功标志
在master上使用jps命令:
$ jps
在weiqi1和weiqi2上使用jps命令
$ jps
4.5 关闭Zookeeper
关闭 master
节点上的 zookeeper 和 weiqi1
,weiqi2
节点的 zookeeper 的命令式一样的。
命令如下:
5. HBase集群安装配置
5.1 安装配置HBase
5.1.1 安装 HBase
上传hbase-2.0.0-bin.tar.gz
安装包到weiqi
文件夹下
解压安装包:
进入到hbase-2.0.0-bin
下:
进入到conf
目录下,分别修改如下配置文件
5.1.2 配置hbase-env.sh
$ nano hbase-env.sh
5.1.3 配置hbase-site.xml
$ nano hbase-site.xml
5.1.4 更改 regionservers
分别把每个节点下的hostname填写到该文件中
$ nano regionservers
5.2 部署他其他节点
5.3 分别配置Hbase环境变量
$ nano /etc/profile
添加:
然后重新加载配置文件使之生效:
5.4 启动Hbase集群
进入master
5.4.1 hbase 启动命令整理
5.5 启动成功标志
在master上使用jps命令:
$ jps
在weiqi1和weiqi2上使用jps命令
$ jps
同时也能在浏览器上通过http://192.168.1.60:16010
web端查看Hbase信息
5.6 关闭Hbase集群
关闭 master
节点上的 hbase