Ethereum 源码分析之ethdb

本文详细分析了以太坊ethdb中的数据库接口、底层支持的leveldb、内存db和pebble库,探讨了leveldb的实现细节,包括接口、基本操作、批处理、迭代器和快照功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. ethdb(ethereum数据库)源码分析以及levelDB

ethdb package 存放在位置 go-ethereum/ethdb中

根据分析ethdb的接口Database:

//Database接口位置: go-ethereum/ethdb/database.go
type Database interface{
    Reader  //读取器:从数据库中读取数据
    Writer  //写入器:向数据库中写入数据
    Batcher //支持数据存储的接口,将多个操作合并到一个批处理任务中,然后一次性提交给数据库执行.
            //减少I/O次数
    Iterator //创建数据库内容的二进制字母排序迭代器的方法.
    Stater   //提供了各种从键值数据库和不可改变的原始数据中检索到状态的方法
    Compacter //方法用于给定键范围的底层数据存储进行压缩。它的作用是丢弃已删除和被覆盖的版本,
    //并重新排列数据,以减少访问它们所需的操作成本.
    Snapshotter //基于当前状态创建一个数据库快照,所创建的快照将
}
//上述中都是接口,那么ethdb的数据库必须要实现上述接口中的所有方法.

底层数据库支持leveldb(kv键值存储库),memorydb(内存数据库)以及pebble(kv键值存储库)三种数据库. leveldb是最常用和成熟的选项,而memorydb则适用于对速度要求较高且数据不需要持久化的场景.
在这里插入图片描述

接下来我们将会介绍leveldb的底层数据库实现下的ethdb:

1.1 go-ethereum/leveldb package

package location: go-ethereum/ethdb/leveldb

实际底层数据库是:GitHub - syndtr/goleveldb: LevelDB key/value database in Go. 即go-ethereum/leveldb是对goleveldb的一层封装.go-etheruem/ethdb/leveldb的结构体如下:

type Database struct {
    fn string      // filename for reporting
    db *leveldb.DB // LevelDB instance(leveldb实例)

    //下面的字段都是测量数据库性能的meter.
    compTimeMeter       metrics.Meter // Meter for measuring the total time spent in database compaction
    compReadMeter       metrics.Meter // Meter for measuring the data read during compaction
    compWriteMeter      metrics.Meter // Meter for measuring the data written during compaction
    writeDelayNMeter    metrics.Meter // Meter for measuring the write delay number due to database compaction
    writeDelayMeter     metrics.Meter // Meter for measuring the write delay duration due to database compaction
    diskSizeGauge       metrics.Gauge // Gauge for tracking the size of all the levels in the database
    diskReadMeter       metrics.Meter // Meter for measuring the effective amount of data read
    diskWriteMeter      metrics.Meter // Meter for measuring the effective amount of data written
    memCompGauge        metrics.Gauge // Gauge for tracking the number of memory compaction
    level0CompGauge     metrics.Gauge // Gauge for tracking the number of table compaction in level0
    nonlevel0CompGauge  metrics.Gauge // Gauge for tracking the number of table compaction in non0 level
    seekCompGauge       metrics.Gauge // Gauge for tracking the number of table compaction caused by read opt
    manualMemAllocGauge metrics.Gauge // Gauge to track the amount of memory that has been manually allocated (not a part of runtime/GC)

    levelsGauge [7]metrics.Gauge // Gauge for tracking the number of tables in levels

    quitLock sync.Mutex      // Mutex protecting the quit channel access
    quitChan chan chan error // Quit channel to stop the metrics collection before closing the database

    log log.Logger // Contextual logger tracking the database path
}

我们从go-etheruem/ethdb/leveldb/leveldb_test.go中BenchmarkLevelDB中开始

func BenchmarkLevelDB(b *testing.B) {
    dbtest.BenchDatabaseSuite(b, func() ethdb.KeyValueStore {
        db, err := leveldb.Open(storage.NewMemStorage(), nil)
        if err != nil {
            b.Fatal(err)
        }
        return &Database{
            db: db,
        }
    })
}
//storage.NewMemStorage()
1.2 leveldb feature
  1. 支持基本操作:Put(key,value),Get(key),Delete(key)

    1. key和value都可以是任意的字节数组
  2. Data是按照key排序的,且排序的顺序是可以自定义的.

  3. 批处理(batcher): 多个改变都可以放在一个具有原子性的批处理

  4. 支持向前和向后的迭代器(iteration)

  5. 支持瞬间快照来获得一致性视图

  6. 支持数据自动压缩.

1.2.1 API
创建数据库:
db, err := leveldb.OpenFile(file, options)

读取Get和写入Put操作:
dat, err := db.Get(key, nil) //返回的切片只是拷贝,是可以修改的.
err:=db.Put(key, value, nil)
删除操作:
err:=db.Delete(key, nil)

批量处理
leveldb.Batch{}.
1.2.2 leveldb.batch(原子批量化)的源码分析

github.com/syndtr/goleveldb/leveldb/batch.go文件

leveldb提供的批处理创建的方法有:

func leveldb.MakeBatch(n int) *leveldb.Batch
//实际上就是对data切片设置为n,实际上可以减少cpu开销.


ethdb中的实现Batch方法:
func (db *Database) NewBatch() ethdb.Batch {
    return &batch{
        db: db.db,
        b:  new(leveldb.Batch),
    }
}
ethdb中的batch结构体:创建的时候为一个db绑定一个batch.
type batch struct {
    db   *leveldb.DB
    b    *leveldb.Batch
    size int
}

leveldb的批量处理化(加入操作)如何实现?

批量处理支持Put和Delete操作,那么就需要对外开放Put,Delete操作以及执行(Replay)的操作.

1. 结构体:
type Batch struct{
    data  []byte //存放批量操作的切片
    index []batchIndex //存放每个批量操作在data中的末尾位置

    // internalLen is sums of key/value pair l5. Put和Delete操作ength plus 8-bytes internal key.
    internalLen int
}

2. batchIndex数据类型:
type batchIndex struct{
    keyType            keyType
    keyPos, keyLen     int //一个数组中的实例的位置1. pos+len 或者2. startPos+endPos
    valuePos, valueLen int
}
batchIndex中需要记录一个Put/Delete请求的放在batch中需要记录Key和Value的位置
    keyType的表示:
type keyType uint
keyTypeDel=keyType(0)
keyTypeVal=keyType(1)

3. 重置Batch
func (b *Batch) Reset() {
    b.data = b.data[:0]
    b.index = b.index[:0]
    b.internalLen = 0
}

4. Batch长度:
func (b *Batch) Len() int {
    return len(b.index)
}

5. Put和Delete操作
func (b *Batch) Put(key, value []byte) 
func (b *Batch) Delete(key []byte)

 上面两个实际调用的是appendRec方法

appendRec方法:

import "encoding/binary"

func (b *Batch) appendRec(kt keyType, key, value []byte) {
    //binary.MaxVarintLen32:32位整数经过Varint编码后的最大长度,此时是5.
    //binary.MaxVarintlen32
    n := 1 + binary.MaxVarintLen32 + len(key)
    if kt == keyTypeVal { //如果是put操作则需要加value的长度
        n += binary.MaxVarintLen32 + len(value)
    }
    b.grow(n) //扩展空间
    index := batchIndex{keyType: kt}
    o := len(b.data) //在leveldb中key,value都是[]byte数组.
    data := b.data[:o+n] //data的len长度增加从o变为o+n
    data[o] = byte(kt)//每一个batch中的操作第一个字节表示操作类型,
    o++
    //binary.PutUvarint把uint64编码加入到data切片中
    o += binary.PutUvarint(data[o:], uint64(len(key)))
    index.keyPos = o //记录key存放的开始位置
    index.keyLen = len(key) //记录key存放的长度
    o += copy(data[o:], key) //把key复制到data[0:]
    if kt == keyTypeVal { //put方法,那么就还需要存放val值
        o += binary.PutUvarint(data[o:], uint64(len(value)))
        index.valuePos = o
        index.valueLen = len(value)
        o += copy(data[o:], value)
    }
    b.data = data[:o]
    b.index = append(b.index, index)
    //我觉得应该
    b.internalLen += index.keyLen + index.valueLen + 8
} 

 调用grow方法(切片是由len,cap以及底层数组的指针三元组表示):
func (b *Batch) grow(n int) {
    o := len(b.data) //data的数组长度
    if cap(b.data)-o < n {
        div := 1
        if len(b.index) > batchGrowRec { 
            div = len(b.index) / batchGrowRec
        }
        ndata := make([]byte, o, o+n+o/div) 
        //还会额外增加一部分空间:o+n+o*(batchGrowRec)/(b.index)
        //
        copy(ndata, b.data)
        b.data = ndata
    }
}

leveldb的批量处理化(重现Replay操作)的如何实现?

//批处理就是遍历batch的index数组(数组中的每个元素记录了每一条记录)
func (b *Batch)Replay(r BatchReplay)error{
    for _,index:=range b.index{
        switch index.keytype{
        case keyTypeVal: //put操作,返回key和value的[]byte
            r.Put(index.k(b.data), index.v(b.data))
        case keyTypeDel://delete操作,返回key的[]byte
            r.Delete(index.k(b.data))
        }
    }
}
1.2.3 go-ethereum的leveldb中iterator.Iterator(迭代器)源码分析

leveldb实现的迭代器可以向前向后(forward and backward)

以太坊ethdb底层数据库如果使用的是leveldb,那么对外提供了一个接口来创建leveldb的迭代器,接口如下:

//为满足key的前缀prefix的数据库内容子集创建一个迭代器
func (db *Database) NewIterator(prefix []byte, start []byte) ethdb.Iterator{
    return db.db.NewIterator(bytesPrefixRange(prefix, start), nil)
    //bytesPrefixRange()返回满足的键范围.    
    //return的类型是leveldb包中iterator.Iterator
}
 上述bytesPrefix

我们可以根据上述发现,leveldb中的迭代器实例可以赋值给ethdb.Iterator说明该迭代器实例实现了ethdb.Iterator的方法. ethdb.Iterator的接口如下:

type Iterator interface {
    // 移动迭代器到下一个kv对,返回该迭代器是否是饥饿的(exhausted)
    Next() bool

    // Error returns any accumulated error. Exhausting all the key/value pairs
    // is not considered to be an error.
    Error() error

    // 返回当前迭代器指向的key/value对的key或者nil,且不要对返回的切片的值进行更改
    // 如果需要对切片的值更改,需要用copy方式
    Key() []byte

    //返回当前迭代器指向的key/value对的value或者nil,且不要对返回的切片的值进行更改\
    //如果需要对切片的值更改,需要用copy方式
    Value() []byte

    //Release是释放相关的资源,Release是可以被调用多次的且不会返回error.
    Release()
}
1.2.4 go-ethereum的leveldb中snapshot(快照)

在以太坊go-ethereum/ethdb/snapshot.go中定义了快照接口的类型:

type Snapshot interface{
    //检索键值存储数据存储支持的快照中是否存在
    Has(key []byte)(bool,error)
    // 检索键值存储数据存储支持的快照中并返回key所对应的value
    Get(key []byte)([]byte,error)
    //释放资源
    Release()
}        
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Blockchain410

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值