Hbase是一个开源的分布式的NoSql数据库,采用列式存储,可支持数十亿行、百万列的数据存储和检索。由于其高效的读写性能,被广泛应用于大数据领域非结构化数据的存储和快速检索场景。
Hbase采用Master/Slave模式,集群由一到多个Master组成,Master做为管理节点,一般不存储数据。多个Slave节点做为数据存储节点,受master管理。一般Master节点叫做HMaster,同时只有一个处于active状态,其他Master处于Backup状态,类似于Hadoop的NameNode的HA。Slave节点被成为RegionServer,Hbase数据存储在多个Region中,RegionServer负责管理这些Region。
前提
- 三台linux服务器,分别命名为node1、node2、node3(已在/etc/hosts文件里做好了ip和名字的映射)
- 已经安装hdfs
- 已经安装zookeeper
- 安装包下载
地址一:Apache HBase – Apache HBase Downloads
地址二:Index of /hbase
- 解压并移动
tar -zxf hbase-2.4.17-bin.tar.gz
mv hbase-2.4.17 /usr/local/
- 配置环境变量
vi /etc/profile export HBASE_HOME=/export/servers/hbase export PATH=$PATH:$HBASE_HOME/bin 刷新环境变量,使配置生效 source /etc/profile
- 修改hbase-site.xml文件
vim hbase-site.xml <configuration> <property> <name>hbase.cluster.distributed</name> <value>true</value> </property> <property> <name>hbase.rootdir</name> <value>hdfs://node1:8020/hbase</