B树与B+树

B树

B树是一种多路搜索树(并不是二叉的):

  1. 定义任意非叶子结点最多只有M个儿子;且M>2;

  2. 根结点的儿子数为[2, M];

  3. 除根结点以外的非叶子结点的儿子数为[M/2, M];

  4. 每个结点存放至少M/2-1(取上整)和至多M-1个关键字;(至少2个关键字)

  5. 非叶子结点的关键字个数=指向儿子的指针个数-1;

  6. 非叶子结点的关键字:K[1], K[2], …, K[M-1];且K[i] < K[i+1];

  7. 非叶子结点的指针:P[1], P[2], …,
    P[M];其中P[1]指向关键字小于K[1]的子树,P[M]指向关键字大于K[M-1]的子树,其它P[i]指向关键字属于(K[i-1],K[i])的子树;

  8. 所有叶子结点位于同一层;

如图,M=3:
这里写图片描述

B-树的搜索,从根结点开始,对结点内的关键字(有序)序列进行二分查找,如果命中则结束,否则进入查询关键字所属范围的儿子结点;重复,直到所对应的儿子指针为空,或已经是叶子结点;

B树的特性:

  1. 关键字集合分布在整颗树中;

  2. 任何一个关键字出现且只出现在一个结点中;

  3. 搜索有可能在非叶子结点结束;

  4. 其搜索性能等价于在关键字全集内做一次二分查找;

  5. 自动层次控制;

B+树

B+树是B树的变体,也是一种多路搜索树,其定义基本与B-树同,除了:

  1. 非叶子结点的子树指针与关键字个数相同;

  2. 非叶子结点的子树指针P[i],指向关键字值属于[K[i], K[i+1])的子树(B树是开区间);

  3. 为所有叶子结点增加一个链指针;

  4. 所有关键字都在叶子结点出现;

如图,M=3:
这里写图片描述

B+的搜索与B树也基本相同,区别是B+树只有达到叶子结点才命中(B树可以在非叶子结点命中),其性能也等价于在关键字全集做一次二分查找;

B+树的特性:

  1. 所有关键字都出现在叶子结点的链表中(稠密索引),且链表中的关键字恰好是有序的;

  2. 不可能在非叶子结点命中;

  3. 非叶子结点相当于是叶子结点的索引(稀疏索引),叶子结点相当于是存储(关键字)数据的数据层;

  4. 更适合文件索引系统;

总结

B树和B+树的特点是一样的,是多路查找树,一般用于数据库中做索引,因为它们分支多层数少,因为磁盘IO是非常耗时的,而像大量数据存储在磁盘中所以我们要有效的减少磁盘IO次数避免磁盘频繁的查找。
B+树是B树的变种树,有n棵子树的节点中含有n个关键字,每个关键字不保存数据,只用来索引,数据都保存在叶子节点。是为文件系统而生的。
B+树相对B树磁盘读写代价更低:因为B+树非叶子结点只存储键值,单个节点占空间小,索引块能够存储更多的节点,从磁盘读索引时所需的索引块更少,所以索引查找时I/O次数较B-Tree索引少,效率更高。而且B+Tree在叶子节点存放的记录以链表的形式链接,范围查找或遍历效率更高。MySQL InnoDB用的就是B+Tree索引。

### 对比 - **结构差异**:B的中间节保存节数据,而B+的中间节不保存数据,数据仅保存在叶子节中。这使得磁盘页能容纳更多的节元素,让B+更“矮胖”[^2]。 - **查找方式**:B只要匹配到元素,查找即可结束,不用管元素在什么位置;而B+查找必须匹配到叶子节,所以B+查找更稳定[^2]。 - **范围查询**:对于范围查询,B要从头到尾查找,而B+只需要在一定范围内的叶子节中查找。另外,B+的叶子节通过指针连接,从左到右顺序排列,方便进行范围操作;B+的非叶子节叶子节冗余[^2]。 ### 特 - **B**:所有节既存储key也存储value,当内存中存不下时再存到磁盘。每个结最多有m棵子,具有k个子的非叶结包含k - 1个键。每个非叶子结(除了根)具有至少⌈ m/2⌉子,即最少有⌈ m/2⌉ - 1个关键字。若根不是终端结,则根结至少有一个关键字,即至少有2棵子。所有叶子结都出现在同一水平,没有任何信息(高度一致)[^4]。 - **B+**:是B的一种变种,在B基础上进行了优化,以更好地适应外部存储(如磁盘)的读写操作。所有值都存储在叶子节上,并且叶子节之间通过指针相连,形成有序链表,便于进行顺序访问范围查询。节分为内部节叶子节,内部节仅存储键值用于索引,叶子节存储键值数据,且叶子节之间通过指针相连。插入删除操作可能会引起节的分裂合并,以保持的平衡有序性[^3]。 ### 应用 - **B**:文件系统更常用B,在大数据的存储查找中也有应用,不过相较于B+使用场景相对较少[^1][4]。 - **B+**:更适合做磁盘索引,在大数据的存储查找中使用较多,比如海量图像查找引擎。数据库偏爱B+,如MySQL的InnoDB默认使用B+,还有文件系统如Btrfs、ReiserFS也会使用,适用于需要高效范围查询排序的场景[^1][4][5]。 ### 代码示例(简单示意B+查找操作) ```python class BPlusTreeNode: def __init__(self, is_leaf=False): self.is_leaf = is_leaf self.keys = [] self.child = [] self.next = None class BPlusTree: def __init__(self, degree): self.root = BPlusTreeNode(is_leaf=True) self.degree = degree def search(self, key): node = self.root while not node.is_leaf: i = 0 while i < len(node.keys) and key > node.keys[i]: i += 1 node = node.child[i] for i in range(len(node.keys)): if node.keys[i] == key: return True return False ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值