Bitcask:A Log-Structured Hash Table for Fast Key/Value Data 阅读笔记

Bitcask是一种日志结构化的哈希表,用于快速键值数据处理。系统保证单进程写入,文件达到一定大小后关闭并新建。文件一旦关闭即不可变,写操作在活跃文件中追加,减少磁盘搜索。内存中的keydir哈希表存储文件、偏移量等信息。读操作获取最新版本数据,定期进行合并优化空间利用,合并后创建回滚日志。读性能依赖操作系统缓存,可添加内部读缓存。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一个Bitcask实例就是一个目录,我们保证在一个时刻只有一个系统进程可以打开Bitcask进行写操作。
在一个时刻,只有一个文件是“active”的。当文件达到一定的大小限制就会关闭,并创建一个新的“active”文件。
一旦一个文件关闭了,就视为是不可变的,即不会再打开来进行写操作。
在这里插入图片描述

“active”file是以追加的方式来进行写操作,意味着顺序写不会导致磁盘搜索。

一个key-value entry的结构如下:
在这里插入图片描述
一个Bitcask数据文件的结构如下所示:
在这里插入图片描述

当追加完成之后,一个在内存中的称为“keydir”的结构就已经更新了。一个keydir就是一个哈希表,每一个key都映射到一个包含文件、偏移量、大小等信息的结构体。大概看起来像是这样:
在这里插入图片描述

当一个写操作发生时,keydir会自动更新数据。虽然旧数据还存在磁盘中,但是新的读操作将会根据keydir读取到最新版本的数据。之后会讲解merge process来移除旧数据。

读操作的流程如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值