B树详解：结构、插入与删除-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_44261638/article/details/103561496

本文详细介绍了B树的特性，包括其与二叉搜索树的区别，以及4阶B树的性质。在B树的插入和删除操作中，重点讨论了上溢、下溢的处理策略，包括节点合并、元素旋转等。B树在数据库和文件系统中的应用，使其成为数据结构的重要组成部分。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

B树是一种平衡的多路搜索树，多用于文件系统，数据库的实现

B树的特点
1、一个节点可以储存超过两个元素，可以拥有超过两个子节点
2、拥有二叉搜索树的一些性质
3、平衡：每个节点的子树的高度都是一样
4、比较矮
在这里插入图片描述

m阶B树的性质
假设一个节点存储的元素个数为 x
1：根节点元素数量：1 ≤ x ≤ m − 1
2：非根节点元素的数量：┌ m/2 ┐ − 1 ≤ x ≤ m − 1:

如果有子节点，子节点个数 y = x + 1
1：根节点：2 ≤ y ≤ m
2：非根节点：┌ m/2 ┐ ≤ y ≤ m

比如：
比如 m = 3，2 ≤ y ≤ 3，因此可以称为（2, 3）树、2-3树
比如 m = 4，2 ≤ y ≤ 4，因此可以称为（2, 4）树、2-3-4树
比如 m = 5，3 ≤ y ≤ 5，因此可以称为（3, 5）树
比如 m = 6，3 ≤ y ≤ 6，因此可以称为（3, 6）树
比如 m = 7，4 ≤ y ≤ 7，因此可以称为（4, 7）树

思考：如果 m = 2，那B树是什么样子？
只有一个节点（只有根节点？）
你猜数据库实现中一般用几阶B树？
数据库用的B树一般都是两百到三百阶

B树 VS 二叉搜索树

1、B树和二叉搜索树，在逻辑上是等价的
2、2代合并的超级节点，最多拥有 4 个子节点（至少是 4阶B树）
3、3代合并的超级节点，最多拥有 8 个子节点（至少是 8阶B树）
4、n代合并的超级节点，最多拥有2^N个子节点（至少是2 ^ n阶B树）
5、m阶B树，最多需要 log 2 m 代合并

在这里插入图片描述

B树的搜索：
跟二叉搜索树的搜索类似

1、先在节点内部从小到大开始搜索元素
2、如果命中，搜索结束
3、如果未命中，再去对应的子节点中搜索元素，重复步骤 1

B树的添加：
新添加的元素必定是添加到叶子节点

在这里插入图片描述

插入55：
在这里插入图片描述
插入95

在这里插入图片描述
再插入 98 呢？（假设这是一棵 4阶B树，特点是非根节点元素的数量不能大于：3）
最右下角的叶子节点的元素个数将超过限制
这种现象可以称之为：上溢（overflow）

添加 – 上溢的解决(假设5阶)

上溢节点的元素个数必然等于 m
假设上溢节点最中间元素的位置为 k
将 k 位置的元素向上与父节点合并

将 [0, k-1] 和 [k + 1, m - 1] 位置的元素分裂成 2 个子节点
✓ 这 2 个子节点的元素个数，必然都不会低于最低限制（┌ m/2 ┐ − 1）

一次分裂完毕后，有可能导致父节点上溢，依然按照上述方法解决
最极端的情况，有可能一直分裂到根节点
在这里插入图片描述

删除 – 叶子节点

假如需要删除的元素在叶子节点中，那么直接删除即可
在这里插入图片描述
删除 30

删除 – 非叶子节点

假如需要删除的元素在非叶子节点中
1、先找到前驱或后继元素，覆盖所需删除元素的值
2、再把前驱或后继元素删除
在这里插入图片描述

非叶子节点的前驱或后继元素，必定在叶子节点中
所以这里的删除前驱或后继元素，就是最开始提到的情况：删除的元素在叶子节点中
真正的删除元素都是发生在叶子节点中

删除 – 下溢

在这里插入图片描述删除 22 ？（假设这是一棵 5阶B树）
叶子节点被删掉一个元素后，元素个数可能会低于最低限制（ ≥ ┌ m/2 ┐ − 1 ）
这种现象称为：下溢（underflow）

删除 – 下溢的解决
下溢节点的元素数量必然等于 ┌ m/2 ┐ − 2
如果下溢节点临近的兄弟节点，有至少 ┌ m/2 ┐ 个元素，可以向其借一个元素
将父节点的元素 b 插入到下溢节点的 0 位置（最小位置）
用兄弟节点的元素 a（最大的元素）替代父节点的元素 b
这种操作其实就是：旋转
在这里插入图片描述
◼ 如果下溢节点临近的兄弟节点，只有 ┌ m/2 ┐ − 1 个元素
将父节点的元素 b 挪下来跟左右子节点进行合并
合并后的节点元素个数等于┌ m/2 ┐ + ┌ m/2 ┐ − 2，不超过 m − 1
这个操作可能会导致父节点下溢，依然按照上述方法解决，下溢现象可能会一直往上传播