论文阅读（8）：slimdb

最新推荐文章于 2024-09-09 09:48:03 发布

原创

最新推荐文章于 2024-09-09 09:48:03 发布 · 998 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

SlimDB是针对半排序数据的键值存储引擎，通过stepped-merge、blockindex优化和cuckoo-filter等技术提升空间效率和读性能。它适用于推荐系统特征存储、文件系统元数据管理和图基系统。stepped-merge策略减少了写放大的开销，blockindex策略利用三级结构快速定位目标键，而cuckoo-filter提供更精确的键存在检查，优于布隆过滤器。

SlimDB: A Space-Efficient Key-Value Storage Engine For Semi-Sorted Data

REN KAI,CMU

问题起源：很多应用中，ｋｅｙ不需要完全有序。而是将ｋｅｙ分为ｐｒｅｆｉｘ和ｓｕｆｆｉｘ。范围查询只要将共享一个ｐｒｅｆｉｘ的所有ｅｎｔｒｙ　ｉｔｅｒ一遍就可以。经常出现这样的ｗｏｒｋｌｏａｄ叫做ｓｅｍｉｓｏｒｔｅｄ。

应用场景：推荐系统的特征存储，文件系统的元数据管理，基于图的系统。

本文提出的优化措施有三条，依次是ｓｔｅｐｐｅｄ－ｍｅｒｇｅ，ｂｌｏｃｋｉｎｄｅｘ优化，ｃｕｃｋｏｏｆｉｌｔｅｒ。

在这里插入图片描述
stepped-merge的lsm结构，leveli在compact过程中，会将所有sublevel的sstable合并成leveli+1的一个sublevel，这样不用承担leveli+1层sstable重写的写放大开销，类似的概念出现过很多次。但这样会导致sublevel之间keyrange的交叠。所以作者又提出了提高读性能的两个策略。
在这里插入图片描述
lsm可以在不同级别使用不同的indexblock实现策略。本文在l0-l2使用的是3级的block index策略。第一级保存不同的前缀，第二级保存不同前缀最后一次出现的blockid，比如4，对应的是第三个block的开始的key（

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。