Hbase将大量数据列式存储,并且适合存储非关系型数据库,存储的数据类型都是二进制类型,这和传统的关系型数据库就有很大的区别,Hbase是基于zookeeper去进行管理的,与hive不同,hive是基于mapreduce,但他们最终都存储在hdfs上,Hbase一般对数据进行实时处理,而hive一般用于离线处理
Hbase的数据库叫NameSpace,对应着关系型数据库里面的database;
Hbase的数据库底下也有自己的表,如果有的列的值全为空,此时不占内存空间;
Hbase里的每一行代表一个数据对象,并且每一行都有行键(索引)
Hbase里还含有列族(column family)(列族里面保存的就是key-value的键值对),与列修饰符(column qualifier)(列修饰符就是前面的key-value里的key),前两者共同组成了Hbase里的列,列内还有时间戳的概念
下面介绍一些hbase的基础语法:
(1)创建一个namespace:
(2)查看namespace:
(3)查看表:
可以见到我们还没有建表
(4)创建表
如果不写命名空间,那么默认存在namespace名字为default下
(5)查看某个命名空间下有哪些表
可以看见有刚刚创建的表