前言
前面我们说过,leveldb用户通过调用write或者put函数向数据库中写入数据实际上是将数据写入到levedb的Memtable中。我们也曾经提到过,leveldb中有两个MemTable,分别是imm_和mem_,其中imm_是不可写的,因此实际上我们将数据写入到mem_中。leveldb提供持久化,也就是需要将内存中的数据保存到磁盘上,也就是前面说的以sstable的形式将数据持久化。在leveldb中,内存中的每个memtable对应磁盘上的每个sstable,一般情况下我们不希望文件太大,因此必须控制memtable中的数据量,当达到一定的阀值时就要将其写盘。leveldb提供异步写盘的方式,这就是imm_的作用,每次mem_中的数据够多时,就将mem_复制给imm_(两者都是指针,所以复制操作很快),并让mem_指向一个重新申请的memTable。交换之前保证imm为空,然后mem_就可以继续接受用户的数据,同时leveldb开启一个背景线程将imm_写入磁盘。
本文介绍的MakeRoomForWrite是在write函数中调用,以确保mem_有空间可写。如果没有空间可写,就要执行上面的一些列操作。下面我们以这个函数为入口分析一下这个过程。
MakeRoomForWrite 函数的实现
Status DBImpl::MakeRoomForWrite(bool force) {
mutex_.AssertHeld();
assert(!writers_.empty());
bool allow_delay = !force;
Status s;
这几行就是确定该函数是在临界区中执行的,以及设置是否允许延迟写入的标记。
后面就是一个大的while循环,该循环会一直执行,直到mem_中有空间可供写。
while (true) {
if (!bg_error_.ok()) { //背景线程执行有错误,直接返回
// Yield previous error
s = bg_error_;
break;
}
这个条件主要是判断背景线程是否出错,如果出错就直接返回
else if (
allow_delay &&
versions_->NumLevelFiles(0) >= config::kL0_SlowdownWritesTrigger) {
//level 0 中的文件过多,则需要后台线程compact,延迟写
// We are getting close to hitting a hard limit on the number of
// L0 files. Rather than delaying a single write by several
// seconds when we hit the hard limit, start delaying each
// individual write by 1ms to reduce latency variance. Also,
// this delay hands over some CPU to the compaction thread in
// case it is sharing the same core as the writer.
mutex_.Unlock();
env_->SleepForMicroseconds(1000);
allow_delay =