HBase-7 HBase的flush和compact

HBase内存与磁盘管理:flush与compact详解
本文详细介绍了HBase的flush和compact机制。flush是将内存中的数据写入磁盘,当memstore达到特定大小或时间限制时触发。compact是HFile文件的合并过程,用于减少小文件数量提升查询效率。文章涵盖了flush的触发条件、流程,以及compact的两种类型——小合并和大合并的触发与特点。

Flush和compact概念

  • flush可以简单的理解为将数据从内存落地到磁盘
    • 每次flush的过程中的prepare阶段都会有短时间的加锁阻塞,这个过程很短不影响读写
    • 从region级别的flush触发条件开始,一旦触发,就会flush所有memstore,这是不建议由很多列族的一个重要原因
    • 在达到阻塞条件前(默认是JVM内存大小*0.4),可以一边向memstore写数据,一边flush
  • compact可以简单的理解为HFile文件的合并,目的是为了防止小文件过多导致查询效率下降。
    在这里插入图片描述

Flush触发条件

从容器的大小来看,从小到大可以分为以下3个级别

memstore级别限制

  • 当region中的任意一个 Memstore达到了上限(hbase.hregion.memstore.flush.size,默认128MB),就会触发memstore刷新
  • 可以通过更改配置文件来更改默认大小
<property>
	<name>hbase.hregion.memstore.flush.size</name>
	<value>134217728</value>
</property>

region级别限制

  • 当Region中所有Memstore的大小总和达到了上限(hbase.hregion.memstore.block.multiplier * hbase.hregion.memstore.flush.size,默认 2* 128M = 256M),会触发memstore刷新
  • 可以通过更改配置文件来更改默认大小
<property>
	<name>hbase.hregion.memstore.flush.size</name>
	<value>134217728</value>
</property>
<property>
	<name>hbase.hregion
### Flush 机制 Flush 机制是将内存中的数据持久化到磁盘的过程。当满足以下条件时会触发 Flush 操作: - 单个 region 里 memstore 的缓存大小达到 `hbase.hregion.memstore.flush.size`(默认 128M)。 - 达到 `hbase.regionserver.optionalcacheflushinterval`(默认 1h)的时间间隔。 - 全局 memstore 大小超过 `hbase.regionserver.global.memstore.size`(默认堆大小的 40%),此时会将所有的 memstore 全部 flush,并且会阻塞客户端读写。 - 全局 memstore 大小达到 `hbase.regionserver.global.memstore.size.lower.limit`(默认堆大小 0.95 倍)。 - 提前进行 flush,当达到 `hbase.hregion.preclose.flush.size`(默认为 5M)时,先 flush 一小部分,等后面数据达到阈值再 flush 后面的数据,这样比一次 flush 效率高 [^1]。 RegionServer 的 flush 是通过将请求添加到一个队列,模拟生产消费模式来异步处理的。不过当队列来不及消费,产生大量积压请求时,可能会导致内存陡增,最坏的情况是触发 OOM [^2]。 ### Compact 机制 Compact 机制主要用于合并小的 HFile 文件,以减少文件数量,提高读取性能。随着数据的不断写入,会产生大量的小 HFile 文件,过多的小文件会增加磁盘 I/O 开销元数据管理负担。Compact 分为两种类型: - **Minor Compact**:将多个小的 HFile 文件合并成一个较大的 HFile 文件,通常只合并一部分满足条件的小文件。 - **Major Compact**:将一个 Region 下的所有 HFile 文件合并成一个大的 HFile 文件,会清理掉过期数据被删除的数据。 ### Split 机制 当该 region 的一个 store 的 storefile 大小之,即一个 store 的大小超过 `hbase.hregion.max.filesize` 时,这个 region 会被拆分。Split 的入口在 memstore flush 操作之后,HRegion 写入新的 Hfile 或者 HStore 刚刚进行完 compact 操作后 [^3]。 ```xml <!-- 示例配置参数 --> <property> <name>hbase.hregion.memstore.flush.size</name> <value>134217728</value> <!-- 128M --> </property> <property> <name>hbase.regionserver.optionalcacheflushinterval</name> <value>3600000</value> <!-- 1h --> </property> <property> <name>hbase.regionserver.global.memstore.size</name> <value>0.4</value> </property> <property> <name>hbase.hregion.max.filesize</name> <value>10737418240</value> <!-- 10G --> </property> ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值