HBase主要运行机制(物理存储和逻辑架构)

本文详细介绍了HBase的物理存储和逻辑架构。在物理存储方面,HBase通过行键排序并分区为Region,随着数据增长,Region会分裂并均匀分布在Region Server上。每个Region由Store组成,Store包含memStore和HFile形式的Store File。在逻辑架构层面,HBase运行在HDFS之上,由Master、Region Server和Zookeeper构成。Master负责表和Region管理,Region Server处理读写操作,Zookeeper确保高可用性和Region Server状态管理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本节将对 HBase 的主要运行机制进行简单介绍。

HBase 的物理存储

HBase 表中的所有行都是按照行键的字典序排列的。因为一张表中包含的行的数量非常多,有时候会高达几亿行,所以需要分布存储到多台服务器上。

因此,当一张表的行太多的时候,HBase 就会根据行键的值对表中的行进行分区,每个行区间构成一个“分区(Region)”,包含了位于某个值域区间内的所有数据,如图 1 所示。

HBase的Region存储模式图
图 1  HBase的Region存储模式图

Region 是按大小分割的,每个表一开始只有二个 Region,随着数据不断插入到表中,Region 不断增大,当增大到一个阈值的时候,Region 就会等分为两个新的 Region。当表中的行不断增多时,就会有越来越多的 Region,如图 2 所示。

HBase的Region分裂示意
图 2  HBase的Region分裂示意

Region 是 HBase 中数据分发和负载均衡的最小单元,默认大小是 100MB 到 200MB。不同的 Region 可以分布在不同的 Region Server 上,但一个 Region 不会拆分到多个 Region Server 上。每个 Region Server 负责管理一个 Region 集合。如图 3 所示。

HBase的Region分布模式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值