概述
HBase是一个构建在hdfs之上的分布式的的Nosql数据库
HBase适合对于海量数据进行实时随机读写
HBase一张表能够支撑数十亿行,数百万列
HBase从设计上来说由三部分构成
HBase Master :负责处理region分配 DDL 操作
Region-server : 数据读写
底层数据存储和集群协同交给 hdfs 和 zookeeper进行管理
数据模型
思维数据模型定义数据
RowKey:HBase每一行必须有一个唯一行建
Column Family:每一列都属于一个列簇
Column :列来定义属性字段
Version:数据每次新增修改都会产生一个新版本
Regions
HBase表以RowKey的起止区间为范围水平切分多个region
每个region包含了RowKey从开始到结束的所有行
一个RegionServer大约可以容纳1000个Region
一个regionserver 包含多个region 每个region包含一部分数据
HBase Master
负责Region分配 DDL操作
Region Server
WAL HDFS的一个文件,是一种容灾策略
BlockCache 读缓存LRU失效策略
MemStore 写缓存,每个列簇都有一个
Hfile:数据存储的载体,hdfs的一个文件