简介
HBase是Hadoop的生态系统,是建立在Hadoop文件系统(HDFS)之上的分布式、面向列的数据库,通过利用Hadoop的文件系统提供容错能力。如果你需要进行实时读写或者随机访问大规模的数据集的时候,请考虑使用HBase!
参考:https://wiki.imooc.com/hbase/introduce.html
官网:https://hbase.apache.org/
官网中文页(官网页面中有链接):http://abloz.com/hbase/book.html
hbase体系
使用Hbase,需要先安装HDFS分布式文件系统和Zookeeper注册中心。
Hbase包括主进程master和多个regionServer子进程。
当表数据量很大的时候,可以对表进行分区,分成多个region。regionServer负责管理region。
regionServer会将分区的运行情况报告给master,方便master随时将宕机的region分配到其他的region。
regionServer也会将分区的运行情况报告给zookeeper。

hbase版本提供
hbase前置环境
hbase在hadoop2.x的依赖,参考官网版本要求 https://hbase.apache.org/book.html#quickstart 选择一下版本:
- JDK1.8
- Hadoop-2.7.6以上
- Zookeeper-3.4.5
HBase是建立在Hadoop文件系统(HDFS)之上的分布式、面向列的数据库,它通过利用Hadoop的文件系统提供容错能力。适用于需要进行实时读写或随机访问大规模数据集的应用场景。HBase包括主进程master和多个regionServer子进程,可通过分区提高效率。
811

被折叠的 条评论
为什么被折叠?



