背景:
为什么数据库存储使用b+树 而不是二叉树,因为二叉树树高过高,每次查询都需要访问过多节点,即访问数据块过多,而从磁盘随机读取数据块过于耗时。
1. 表存储结构
单位:表>段>区>页>行
在数据库中, 不论读一行,还是读多行,都是将这些行所在的页进行加载。也就是说存储空间的基本单位是页。
一个页就是一棵树B+树的节点,数据库I/O操作的最小单位是页,与数据库相关的内容都会存储在页的结构里。
2. B+树索引结构
在一棵B+树中,每个节点为都是一个页,每次新建节点的时候,就会申请一个页空间
同一层的节点为之间,通过页的结构构成了一个双向链表
非叶子节点为,包括了多个索引行,每个索引行里存储索引键和指向下一层页面的指针
叶子节点为,存储了关键字和行记录,在节点内部(也就是页结构的内部)记录之间是一个单向的表
3. B+树页节点结构
有以下几个特点
-
将所有的记录分成几个组, 每组会存储多条记录,
-
页目录存储的是槽(slot),槽相当于分组记录的索引,每个槽指针指向了不同组的最后一个记录
-
我们通过槽定位到组,再查看组中的记录
-
页的主要作用是存储记录,在页中记录以单链表的形式进行存储。
-
单链表优点是插入