存储系统总结(未完)

本文介绍了HBase的两种存储方式:全内存存储和内存+磁盘混合存储。内存主要用于存储索引,支持hash和B+树等结构;磁盘则存放数据文件,采用日志型数据文件,并通过追加方式写入新记录。文章还详细解释了HBase如何使用B+树索引以及memstore和StoreFile的工作原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1)全内存存储

内存存储索引和数据

 

2)内存+磁盘

内存存储索引等,磁盘存储数据文件

索引主要有hash和B+树等;

磁盘数据文件大多采用日志性数据文件;只在文件末尾追加而不修改文件,写入和更新是追加新记录,删除也是追加记录(记录的value为特殊的值);此外,还有定期merge数据文件的过程,以免数据文件过多过大(随机io转换为顺序io,加快读写效率)。

 

hbase中使用b+树索引数据(根据row key )所在的Region(一个表由多个Region组成,一个Region包括多个store,每个store存储一个列簇,每个Strore又由一个memStore和0至多个StoreFile组成)。

memstore中的数据是排序的,到达一定大小就冻结,生成storefile。

hbase用bloom filter算法检测某个值是否在一个文件中(读数据时,需要从一系列文件中和memfile中读取值)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值