大数据技术-HBase:HBase 日志划分详解

本文详细介绍了HBase中的日志划分机制,包括如何防止数据丢失、日志划分的过程以及HBase如何在regionserver失效时进行数据恢复。日志划分由HMaster执行,确保region的一致性。分布式日志划分机制在0.92版本引入,显著提高了恢复速度,降低了系统的不可用时间。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我们都知道,hbase数据更新是存储到一个叫做memstore的内存区块,这样可以便于快速写入。当regionserver失效的适合,memstore里面的内容会丢失,因为没有被持久化到磁盘上。为了防止这种情况的数据丢失,更新操作放入memstore的时候被持久化到WAL中。这样可以依据WAL记录的内容对丢失的数据进行replay。

regionserver有多个region。其中的所有region共享同一个WAL文件,每个Edit保持有更新属于哪个region的信息及数据信息。当region被打开的时候,我们需要replay WAL中属于这个region的内容。所以WAL文件内容需要按照region进行分组便于replay。做这个事情的过程就叫做日志划分。

日志划分是由hmaster完成的,发生在集群启动或者regionserver死掉的情况下。由于需要保证一致性,受影响的region需要数据恢复完以后才可用。所以我们需要恢复和replay所有的edit,在region变得可用之前。


当日志划分开始后,日志目录被重命名为:

/ hbase / . logs / & lt ; host & gt ; ,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值