自己动手写数据库(三) 持久化方案与索引树

本文探讨自己动手写数据库时的持久化方案与索引树设计。介绍了内存分块管理,包括如何处理重启后数据丢失问题,提出使用相对偏移值和页首地址+偏移值的指针存储策略。同时讨论了并发控制,通过读写锁确保数据安全。最后讲解了选择B+树作为索引结构的原因,强调了时间复杂度和磁盘IO效率的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

自己动手写数据库(三) 持久化方案与索引树

推荐一点资源

之前说我所有实现都是Go写的,在MonkeyDB2@Github,但是有些同学可能不喜欢Go的风格或者设计思想,
在此推荐大一学弟的项目,Java写的:CauchyDB

内存分块管理

既然要实现一个数据库,我们之前所有的东西都是在内存里面的,这如果服务器关机,那内存里面的数据还不得全部GG啊~所以我们需要对内存进行管理,
将所有的数据操作在我们所管理的内存中进行,无论是索引页还是数据页。但是这样还有一个问题,指针所指的地址,在重新启动后就不见了,这该怎么办呢?
我们可以采用两种方法:1.对于索引树里的孩子指针等指向本页的指针,使用相对于本页的偏移值存储指针而不是存储实际地址,这样在恢复之后,不需要改动
即可正常使用;2.对于指向本页以外的指针(例如索引页指向数据页的指针),使用页首地址+偏移值的方式储存(在MonkeyDB中,我们认为现在的内存大多是
小于1TB的,而我们设置的内存块大小是16M,这样1TB*16M=64位寻址空间,使用一个8Byte的字段即可记录页首地址和偏移),这里我们为什么不直接记录指针
地址呢,因为我们要恢复的时候是以内存块为单位恢复,我们会用一个表来记录恢复前后的地址,因为记录的是块首地址,所以记录时也是用首地址+偏移。

并发控制

另外,数据库不得不考虑的一个问题就是并发控制,并发控制一般采用读写锁的形式,关于读写锁,可以参见博客:平凡的程序员
我们自己分块管理了内存之后,并发的问题就不难解决了,不论是索引页,还是数据页,我们都继承自内存块,然后对内存

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值