B树


B树定义
B树,称为多路平衡查找树。B树中所有结点的孩子结点树的最大值称为B树的阶,通常称为m。

一颗m阶B树或为空树,或为满足以下特性的m叉树:
1.树中每个结点至多有m棵子树(至多含有m-1个关键字)
2.若根结点不是终端结点,则至少有两颗子树
3.除根结点外的所有非叶结点至少有【m/2】棵子树。(至少含有【m/2】-1个关键字)【】是向上取整符号。
4.所有的叶结点都出现在同一层次上,并且不带信息


B树的查找
B树的具体查找步骤如下:
1.先让key与根结点中的关键字比较,如果key等于k[i](k[]为结点内的关键字数组),则查找成功

2.若key < k[1],则到p[0]所指示的子树中进行继续查找

3.若key > k[n],则到p[n]所指示的子树中进行继续查找

4.若k[i] < key < k [i+1],则到p[i]所指示的子树继续查找

5.如果最后遇到空指针,则证明查找不成功


B树的插入

对于关键字的插入,需要找到插入位置。在B树的查找过程中,当遇到空指针时,则证明查找不成功,同时也找到了插入位置,即根据空指针可以确定在最底层非叶结点中的插入位置。

为了方便,称最底层的非叶结点为终端结点。由此可见,B树结点的插入总是落在终端结点上。在插入过程中有可能破坏B树的特性,如果新关键字的插入使得结点中关键字的个数超过规定个数,这时要进行结点的拆分


B树删除
对于关键字的删除,需要找到待删除关键字。在结点中删除关键字的过程中也可能破除B树的特性,如旧关键字的删除可能使得结点中关键字的个数少于规定个数,这时可能需要向其兄弟结点借关键字或者和其孩子结点进行关键字的交换,也可能需要进行结点的合并。其中,和当前结点的孩子结点进行关键字的操作可以保证删除操作总是发生在终端结点上。


更多请查看我的个人博客:https://beatjerome.github.io

### B的数据结构和实现 B是一种自平衡的搜索,广泛应用于数据库和文件系统中。其设计目的是为了减少磁盘访问次数,提高数据检索效率。B的每个节点可以包含多个关键字和子节点指针,且所有叶子节点位于同一层。 #### 1. B的基本定义 B节点组成,每个节点包含一组关键字和一组子节点指针。对于一个最小度数为 \(t\) 的B,有以下特性[^2]: - 每个节点最多包含 \(2t-1\) 个关键字。 - 根节点至少包含一个关键字。 - 非根节点至少包含 \(t-1\) 个关键字。 - 如果某个节点是非叶子节点,则它包含 \(n\) 个关键字和 \(n+1\) 个子节点指针,其中 \(t \leq n \leq 2t-1\)。 - 所有叶子节点都在同一层。 #### 2. B节点的结构 在代码实现中,B节点通常定义如下[^2]: ```c typedef int KEY_VALUE; typedef struct _btree_node { KEY_VALUE *keys; // 关键字数组 struct _btree_node **childrens; // 子节点指针数组 int num; // 当前节点的关键字数量 int leaf; // 是否为叶子节点 } btree_node; ``` #### 3. B的操作 B的主要操作包括插入、删除和查找。以下是这些操作的基本描述: ##### (1) 插入操作 当向B中插入一个新关键字时,可能需要分裂节点以保持的平衡。具体步骤如下: - 如果根节点满,则创建一个新的根节点,并将原根节点作为其子节点。 - 自顶向下查找合适的位置插入关键字。 - 如果某节点已满,则将其分裂为两个节点,并将中间关键字上移至父节点。 ##### (2) 删除操作 删除关键字时,可能需要合并或重新分配节点中的关键字以保持的平衡。具体步骤如下: - 查找待删除的关键字。 - 如果关键字存在于非叶子节点,则用其前驱或后继替换该关键字。 - 如果删除导致某节点的关键字数量低于下限,则从兄弟节点借关键字,或与兄弟节点合并。 ##### (3) 查找操作 查找操作通过比较关键字和节点中的值,逐步缩小搜索范围。具体步骤如下: - 从根节点开始,逐层向下查找。 - 在当前节点中查找目标关键字,如果找到则返回;否则进入相应的子节点继续查找。 #### 4. 示例代码 以下是一个简单的B插入操作的伪代码示例: ```c void btree_insert_nonfull(btree_node *node, KEY_VALUE key) { int i = node->num - 1; if (node->leaf) { // 如果是叶子节点 while (i >= 0 && node->keys[i] > key) { node->keys[i + 1] = node->keys[i]; i--; } node->keys[i + 1] = key; node->num++; } else { // 如果是非叶子节点 while (i >= 0 && node->keys[i] > key) { i--; } i++; if (node->childrens[i]->num == 2 * t - 1) { // 如果子节点已满 split_child(node, i); if (key > node->keys[i]) { i++; } } btree_insert_nonfull(node->childrens[i], key); } } ``` #### 5. B与B+的对比 尽管B功能强大,但在实际应用中,B+更为常用。B+对B进行了优化,主要改进点包括[^1]: - 所有关键字都存储在叶子节点中,便于范围查询。 - 叶子节点之间通过链表连接,支持顺序访问。 - 非叶子节点仅用于索引,不存储实际数据。 ### 总结 B是一种高效的多路平衡搜索,适用于大规模数据存储和检索场景。其核心在于通过节点分裂和合并保持的平衡性,从而确保操作的时间复杂度为 \(O(\log n)\)。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值