HBase基本介绍
HBase是一个Nosql数据库,以列的方式进行数据的存储和管理.
HBASE和Hadoop是紧耦合关系
hive与HBASE都是实时读写数据库,其中hive读写慢,适合离线处理,HBASE实时读写快,因为有索引rowkey
hbase存储结构化或半结构化的松散数据.
hive存储结构化数据
注意:
松散数据:有空数据则不写
紧密数据:有空数据用null
HBASE支持的类型为:byte[]
HBASE中只有表没有库
Hadoop与HBASE的关系
(其实是hdfs与HBASE的关系)
hdfs
①分布式文件存储系统
②适合一次写入多次读取
③不适合随机读取(因为没有索引)
HBASE
①面向列数据存储,依赖于hdfs
②适合多次的频繁写入和读取
③可以随机读取某些数据
RDBMS(关系型数据库)与HBASE的关系
关系型数据库
①以表的形式存在
②支持sql面向行的查询,面向列的查询
③适合结构化数据
④支持事物
HBASE
①以region(区域)形式存在一张表的逻辑上划分为一个或多个region管理
②api或mr进行数据读取
③面向列存储
④和zookeeper是紧耦合关系
⑤适合存储结构化和半结构化松散数据
HBASE特征
①适合存储海量数据
②列式存储(列族或列簇)
③适合高并发
④数据存储是稀疏的
13万+

被折叠的 条评论
为什么被折叠?



