自己动手写数据库(三) 持久化方案与索引树
推荐一点资源
之前说我所有实现都是Go写的,在MonkeyDB2@Github,但是有些同学可能不喜欢Go的风格或者设计思想,
在此推荐大一学弟的项目,Java写的:CauchyDB
内存分块管理
既然要实现一个数据库,我们之前所有的东西都是在内存里面的,这如果服务器关机,那内存里面的数据还不得全部GG啊~所以我们需要对内存进行管理,
将所有的数据操作在我们所管理的内存中进行,无论是索引页还是数据页。但是这样还有一个问题,指针所指的地址,在重新启动后就不见了,这该怎么办呢?
我们可以采用两种方法:1.对于索引树里的孩子指针等指向本页的指针,使用相对于本页的偏移值存储指针而不是存储实际地址,这样在恢复之后,不需要改动
即可正常使用;2.对于指向本页以外的指针(例如索引页指向数据页的指针),使用页首地址+偏移值的方式储存(在MonkeyDB中,我们认为现在的内存大多是
小于1TB的,而我们设置的内存块大小是16M,这样1TB*16M=64位寻址空间,使用一个8Byte的字段即可记录页首地址和偏移),这里我们为什么不直接记录指针
地址呢,因为我们要恢复的时候是以内存块为单位恢复,我们会用一个表来记录恢复前后的地址,因为记录的是块首地址,所以记录时也是用首地址+偏移。
并发控制
另外,数据库不得不考虑的一个问题就是并发控制,并发控制一般采用读写锁的形式,关于读写锁,可以参见博客:平凡的程序员。
我们自己分块管理了内存之后,并发的问题就不难解决了,不论是索引页,还是数据页,我们都继承自内存块,然后对内存