阿里 Hbase的优化策略(上)

本文探讨了HBase中常见GC问题及其解决方案——BucketCacheMemStore。针对原生MemStore存在的问题,如GC效率低下、内存碎片等,阿里云HBase通过优化MemStore的实现,采用基于数组的跳表并进行内存聚合等方式提高CPU缓存效率,减少GC开销,进而提升系统性能。

社区开源的做法

4

常见的HBASE的问题是GC的问题

社区里做的BucketCache MemSore

原生的memstore是跳跃列表

插入的复杂度很高

查询的复杂度很高

是基于ConcurrentSkipListMap实现

但是ConcurrentSkipListMap的MemSore也有很多问题!

(1)新老索引的跨代引用,在做youngGC的时候还会扫描Old这样很好效率极低

(2)内存会越来越大,要维护的SKIPLIST索引的对象也会越来越多,然后会造成内存碎片

(3)数据长度不规则也会造成内存碎片

(4)索引对象本身也需要些内存

1

阿里的优化策略

阿里主要是做了云Hbase的MEMSTORE.

他的优化方面包括了

索引对象&数据内存空间高度聚合使之CPU的缓存效率高了很多
无碎片对GC友好、从而避免了Full GC的问题
节约了内存、加大了吞吐量
节约了YUONGGC的时间
阿里优化的MEMSTORE的原理是什么样的呢?

其实也是基于数组实现的SKIPLIST

每次去申请连续的CHURK内存(1个默认为2M的byte[])
Node的节点NEXT、KEYVALUE的所有信息全部放在chuck上
一些信息被压缩成若干个bit,然后再放入Hbase里

2

加强版的bucket cache

原生的bucket cache ,通过复制解决多个任务引用同一个Block;需要格外的拷贝开销
云HBase bucket cache 是通过基于引用计数实现Block 的智能指针

3

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值