简介
HBase是Apache Hadoop的数据库,能够对大数据提供随机、实时的读写访问功能,具有开源、分布式、可扩展及面向列存储的特点。HBase是由Chang等人基于Google的Bigtable开发而成的。HBase的目标是存储并处理大型的数据,更具体来说是只需要使用普通的硬件配置即可处理由成千上万的行和列组成的大数据。
HBase是一个开源的、分布式的、多版本的、面向列的存储模型。它可以直接使用本地文件系统,也可以使用Hadoop的HDFS文件存储系统。不过,为了提高数据的可靠性和系统的健壮性,并且发挥HBase处理大数据的能力,使用HDFS作为文件存储系统才更为稳妥。
以上内容来自《Hadoop实战》
配置环境
- mac OSX EI Capitan 10.11.5 (master节点)
- 虚拟机:Parallels Desktop
- ubuntukylin 14.04 64bit * 2 (node1节点,node2节点)
- Hadoop 2.6.2
- ZooKeeper 3.4.6
- HBase 1.1.5
- 集群环境:HBaster Master: master(10.211.55.2)
HRegion Server: node1(10.211.55.6) , node2(10.211.55.7)
Hadoop环境配置
由于本系统使用完全分布式配置,并且文件系统选择使用HDFS,因此需要先搭建Hadoop环境。
这部分内容请移步本人另一篇博文,有详细的介绍:Hadoop环境配置。
ZooKeeper环境配置
ZooKeeper在完全分布式环境中必不可少。它的主要作用如下:
- 存储HBase中ROOT表和META表的位置。
- 监控集群中各个机器的状态,可以发现机器故障,并通知HBase Master。
- 负责HBase Master的恢复工作(领导选举)。
此部分内容同上,在另一篇博文里有详细介绍:ZooKeeper环境配置。
HBase环境配置
HBase使用典型的主从架构,集群中只有一个正在运行的HBase Master,剩下均为HRegion Server。因此,完全分布式配置需要在集群中的每台机器中均有相应的配置才行。
1. 下载安装:前往官网点此进入官网下载列表,选择合适的版本下载。
2. 解压缩:
进入到压缩文件所在的目录,执行如下命令:
# 将压缩文件解压缩到当前目录下
tar -zxvf hbase-1.1.5-bin.tar.gz
3. 将解压后的文件夹移动到合适的最终目录(也可不移动,不过记录好此时的目录,配置环境时有用):
# 文件夹改名,方便之后配置,也可忽略此步
mv hbase-1.1.5 hbase
# 将文件夹移动到合适的最终位置,可忽略此步
mv -r hbase /usr/hadoop/hadoop-2.6.2/
4. 配置系统环境变量,此步骤分别需要在mac系统和两个ubuntu系统上分别配置:
mac系统上: