Hbase的数据模型 基本原理 组件
1.1 hbase基本概念
hbase是一个高可靠、高性能、面向列、可伸缩、实时读写的分布式存储系统,利用hbase技术可以在廉价的PC Server上搭建起大规模结构化存储集群
1.2 hbase数据模型
row key
1.决定一行的数据
2.按照字典顺序排列的
3.row key只能存储64k的字节数据
timestamp时间戳
1.在hbase每个cell存储单元对同一份数据有多个版本,根据唯一的时间戳来区分每个版本之间的差异,不同版本的数据按照时间倒序排序,最新的数据版本排在最前面。
2.时间戳的类型是64位整型
3.时间戳可以由hbase(在数据写入时自动)赋值,此时时间戳是精确到毫秒的当前系统时间
4.时间戳也可以由客户显示赋值,如果应用程序要避免数据版本冲突,就必须自己生成具有唯一性的时间戳。
column family列族和qualifier列
1.hbase表中的每一个列都归属于某个列族