12、一种优先级与公平性混合的压缩调度机制

最新推荐文章于 2025-09-28 11:31:44 发布

职场萌新987

最新推荐文章于 2025-09-28 11:31:44 发布

阅读量5

点赞数

CC 4.0 BY-SA版权

分类专栏：并行处理前沿技术探析文章标签： LSM-tree 键值存储压缩调度

本文链接：https://blog.youkuaiyun.com/go5gopher/article/details/153710294

并行处理前沿技术探析专栏收录该内容

71 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

一种优先级与公平性混合的压缩调度机制

1 背景与问题提出

在基于 LSM - tree 的键值存储（KV - Stores）中，压缩操作是一个关键环节。当输入数据量增大时，一次压缩操作涉及的平均文件数量会显著增加。例如，L2 层压缩涉及的平均文件数会从输入数据量为 5 GB 时的 11 个增长到 500 GB 时的 31 个。压缩写放大（WA）的原因是一次压缩中涉及过多的 SSTables，这会导致系统整体写放大，影响系统性能。

传统的基于分数中心优先级的压缩调度机制存在问题。以 LevelDB 为例，它采用分数中心优先级的压缩调度机制，每层的分数定义为 (S_n = N_n/T_n)，其中 (S_n) 是 (L_n) 层的分数，(N_n) 是 (L_n) 层运行时的 SSTables 数量，(T_n) 是 (L_n) 层 SSTables 数量的阈值。通常会选择分数最大的层进行压缩。

然而，L0 层的优先级总是最高，分数默认设为 10000，只要 L0 层的 SSTables 数量达到 4 就会立即进行压缩。这一方面使得更多的内存表可以刷新到磁盘，保证前端写入继续；另一方面，也导致大量 SSTables 滞留，造成 L0 和 L1 之间巨大的写放大，占用大量压缩时间，抑制后续前端写入。这种压缩机会的不平衡促使我们提出一种更平衡的压缩优先级调度机制——Slot。