mit 6.830通关小结

原创

已于 2022-04-13 11:49:42 修改 · 1.6k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2022-03-11 10:49:22 首次发布

本文总结了MIT 6.830数据库实验室的体验，包括lab1到lab6的主要内容：从基本数据结构到事务处理、B+树索引和日志恢复。实验难度逐渐提升，lab4和lab5最具挑战性。文中还提到一些未深入研究的优化点，如并发控制、死锁检测和索引并发，并分享了相关的学习资源。

在这里插入图片描述

lab1 实现基本的数据结构
tuple, page, tupleDesc, iterator等等，难度不大
lab2 实现scan iterator
基于scan iterator 来实现各种聚合函数，比如avg，count，sum，join等
lab3 join 优化
建立一个优化模型，按照主键，非主键，scan 表代价，直方图等进行成本估计，根据估计值来确定多表join的顺序
lab 4 事务以及锁
这一章相对较难，要自己实现一个简单的读写锁，但是6.830中简化了，实现了page-level的锁，粒度比较粗，还有多种死锁的情况，test很给力，建议在写的时候一定要看清楚是哪个transaction 拿到了哪些page的哪些lock，而且这里的代码会影响到后面的lab 5、6，这里主要是按照两阶段锁协议并且no steal / force 的策略
lab 5 B+ 树索引
实现B+树索引，插入、删除、修改，难点在于要把B+树结构以及这三种操作逻辑要捋清楚，还有父节点，子节点；叶子兄弟节点，非叶子节点的指针问题，以及一些边界条件。
lab 6 实现基于 log的rollback 和 recover
lab中并没有真正存在undo log 和redo log，日志结构比较简单，只需要根据偏移处理即可，可以理解成是逻辑上的undo log 和 redo log。