HBase指存储字节数组数据===>byte[]
HBase寻址机制
一个HBase表会被切分成很多Region,然后分别存储到不同的RegoinServer上,
一个列族保存成一个Strore. 一个表有一个或多个列族,Region由一个或多个Strore组成,
Strore= 1个memStrore+n个StroreFile[HFile] n>=0
对同一个行键的访问都会在同样的物理节点上进行操作:比如表包含两个列族,属于两个列族的文件还是保存在相同的节点上。因此行键和节点存在一一对应的关系。
对于多个列族来说。通过读取特定的列族可以极大的减少I/O开销
HBase集群中的角色:
- HMaster: 1个就可以了,但是可以有多个用来实现HA
- HRegoinServer:很多,是真实存储,管理表数据
HBase中的查询只支持:HBase存储的数据类型只有一种:byte[]
- get单行查询
- scan全表查询
- scan范围查询