漫谈RocksDB(二)基础讲解——仿佛兮若轻云之蔽月，飘飘兮若流风之回雪

最新推荐文章于 2025-11-09 23:51:42 发布

原创

最新推荐文章于 2025-11-09 23:51:42 发布 · 3k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#RocksDB

RocksDB是一个嵌入式KV数据库，采用LSM树模型，数据写入先到WAL再入内存的Memtable，满后转为 immutable 并flush到磁盘。其支持ColumnFamily逻辑隔离，提供TransactionDB和OptimisticTransactionDB两种事务模式。此外，RocksDB利用BlockCache提升读取性能，并通过Compaction策略管理SST文件。关键配置如max_background_compactions和bytes_per_sync影响性能。

前言

古话说得好：“工欲善其事必先利其器”，要做好一件事情之前先把工具或者武器强化一下还是很值当的。所以本文将会把RocksDB的主要概念向大家讲解一下，方便后面具体内容的展开。本文所提到的概念大家仅需要了解和留个印象，如果不是很理解的话不需要纠结，后续的章节中会详细展开。

正文

RocksDB的概念纷繁复杂，我根据自己的理解将概念分为架构概念、存储概念以及操作概念，分门别类，帮助大家理解。下面就按照这个观其貌、识其物、辩其行的顺序进行讲解。

架构概念

嵌入式数据库

首先RocksDB是一个嵌入式数据库，这个根本特征决定了RocksDB不需要单独部署，也不需要单独的进程，随应用程序一起部署即可，节省资源且便于管理。

另外由于RocksDB未实现真正意义上的分布式（虽然底层可以使用HDFS目录进行存储，但是数据未作分片，所以无法实现真正的分布式），准确来说是一个单机的KV数据库。

但是没有分布式的血统不代表没有一颗成为分布式应用的心。在实际的分布式使用场景中以RocksDB作为某个副本的存储介质，上层通过Paxos或者Raft协议来保证副本之间的数据一致性，完美的明确了RocksDB在分布式应用使用场景中的定位与作用。

LSM

这是RocksDB的LSM树模型，具体的LSM树相关的概念和知识请参考之前的博文俗话说别在一棵树上吊死，那为什么那么多NOSQL都喜欢在LSM树上吊死呢？

根据这个模型,数据的写入流程为：

任何的写入都会先写到 WAL，然后在写入 Memory Table(Memtable)。当然为了性能，也可以不写入 WAL，但这样就可能面临崩溃丢失数据的风险。Memory Table 通常是一个能支持并发写入的 skiplist，但 RocksDB 同样也支持多种不同的 Memory Table，下面在Memory Table章节详细讲解，用户可以根据实际的业务场景进行选择，如果没有特殊需求，默认即可。
当一个 Memory Table 写满了之后，就会变成 immutable 的 Memory Table，RocksDB 在后台会通过一个 flush 线程根据条件从flush queue中按顺序将 Memory Table flush 到磁盘，生成一个 Sorted String Table(SST) 文件，放在 Level 0 层。当 Level 0 层的 SST 文件个数超过阈值之后，就会通过 Compaction 策略将其放到 Level 1 层，以此类推，直到最底层