Hbase学习（一）

最新推荐文章于 2025-01-15 13:59:47 发布

混合动力火锅

最新推荐文章于 2025-01-15 13:59:47 发布

阅读量203

点赞数

CC 4.0 BY-SA版权

分类专栏：分布式

本文链接：https://blog.youkuaiyun.com/m0_37224390/article/details/82887331

5 篇文章

订阅专栏

本文介绍了HBase的数据模型，包括其概念视图、特点和适用场景。HBase是一个基于列存储的稀疏数据库，支持按Row Key读取数据。其特点是简单操作、动态列增删及多版本存储。适用于大数据高并发的随机读写场景。同时，文章提及了HBase的基本操作，如Shell和Java API的使用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

HBase 的数据模型

Hbase是一个稀疏的长期存储在磁盘上的有序的映射表，因为是稀疏存储，所以同一张表里面的每一行数据都可以有截然不同的列。

数据都是字符串，没有类型

RowKey：行主键， HBase不支持条件查询和Order by等查询，读取记录只能按Row key（及其range）或全表扫描
Column Family：列族，在表创建时声明，每个Column Family为一个存储单元存储在一个Store中
Column：列，HBase的每个列都属于一个列族，以列族名为前缀，如列article:title和article:content属于article列族，会依照列名排序。列可以动态的增加
Timestamp：HBase通过row和column确定一份数据，这份数据的值可能有多个版本，不同版本的值按照时间倒序排序，即最新的数据排在最前面，查询时默认返回最新版本。
Value：值

存储结构可以理解为：

SortedMap（Rowkey,List（

SortedMap（Column,List（

Value,Timestamp

））