HBase简单介绍:
HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。
HBase秘Hadoop的关系就是前者利用后者的文件存储系统。
HBase安装
安装过程
HBase运行有两种模式——单机式和分布式。
在单机模式中,HBase使用本地文件系统;而分布式模式需要使用 Hadoop Distributed File System (HDFS)。
分布式模式分两种。伪分布式模式是把进程运行在一台机器上,但不是一个JVM.而完全分布式模式就是把整个服务被分布在各个节点上了。
如题,本文是关于伪分布模式的,其它模式的安装可以在HBase官方文档中文版中找到。
以下参考Jerry Tom的博客 HBse的安装,如果这个链接打不开,就看这个,后者为我转载的。
之前看过很多文章,或讲得比较片面,或根本就讲不清楚,上面这篇文章讲清楚了这么几件事情:
1 hbase和hadoop版本要匹配,如果不匹配怎么解决
2 hbase-env.sh 和 hbase-site.xml的配置,没有多余的配置,切中要害
3 zookeeper与hbase的关系
以下是我的安装情况
1)下载并解压
HBase版本跟Hadoop的版本要匹配才行,我使用hadoop-1.2.1版本,于是选择hbase-0.94.11版本。
在网上搜索并下载hbase-0.94.11.tar.gz,重命名为hbase,解压并放到/usr/下,与hadoop并列,解压命令为tar zvxf hbase-0.94.11.tar.gz
注意,hbase的位置并不受hadoop的影响,可以随意放。
2)配置安装路径
将hbase下的bin目录添加到系统的path中,在/etc/profile文件尾行添加如下的内容这样就不用非得到hbase的bin目录下就可以运行hbase的命令了(对hadoop也可以这样做)
>sudo vim /etc/profile
export PATH=$PATH:/usr/hbase-0.94.11/bin
执行source命令使上述配置在当前终端立即生效