b树,b+树,红黑树

B树的设计目的:

b树是一种平衡的多路查找树。B树是为了磁盘或其它存储设备而设计的一种多叉平衡查找树
B-树上算法的执行时间主要由读、写磁盘的次数来决定,故一次I/O操作应读写尽可能多的信息。因此B-树的结点规模一般以一个磁盘页为单位。一个结点包含的关键字及其孩子个数取决于磁盘页的大小。

性质:

一个m阶(一个节点有m个元素称为m阶)的B树具有如下性质:
树中每个结点至多有m个孩子。
除根结点和叶子结点外,其它每个结点至少有[m/2]个孩子。[]表示不小于m/2的最小整数。
根结点至少有2个孩子(如果B树只有一个结点除外)。
所有叶结点在同一层,B树的叶结点可以看成一种外部节点,不包含任何信息。

有k个关键字(关键字按递增次序排列)的非叶结点恰好有k+1个孩子。

比如,一棵3阶B-树,m=3。它满足:
(1)每个结点的孩子个数小于等于3。
(2)除根结点外,其他结点至少有=2即([3/2])个孩子。
(3)根结点有两个孩子结点。
(4)除根结点外的所有结点的n大于等于=1,小于等于2。
(5)所有叶结点都在同一层上。
这里写图片描述

1、B-树的查找

B-树的查找过程:根据给定值查找结点和在结点的关键字中进行查找交叉进行。首先从根结点开始重复如下过程:

若比结点的第一个关键字小,则查找在该结点第一个指针指向的结点进行;若等于结点中某个关键字,则查找成功;若在两个关键字之间,则查找在它们之间的指针指向的结点进行;若比该结点所有关键字大,则查找在该结点最后一个指针指向的结点进行;若查找已经到达某个叶结点,则说明给定值对应的数据记录不存在,查找失败。

  1. B-树的插入

插入的过程分两步完成:

(1)利用前述的B-树的查找算法查找关键字的插入位置。若找到,则说明该关键字已经存在,直接返回。否则查找操作必失败于某个最低层的非终端结点上。

(2)判断该结点是否还有空位置。即判断该结点的关键字总数是否满足n<=m-1。若满足,则说明该结点还有空位置,直接把关键字k插入到该结点的合适位置上。若不满足,说明该结点己没有空位置,需要把结点分裂成两个。

分裂的方法是:生成一新结点。把原结点上的关键字和k按升序排序后,从中间位置把关键字(不包括中间位置的关键字)分成两部分。左部分所含关键字放在旧结点中,右部分所含关键字放在新结点中,中间位置的关键字连同新结点的存储位置插入到父结点中。如果父结点的关键字个数也超过(m-1),则要再分裂,再往上插。直至这个过程传到根结点为止。
这里写图片描述

B树的存储结构

struct B_TNode{
    int numOfKey;//关键字个数
    B_TNode *parent;//指向父结点的指针
    B_TNode **childPtr;//指向子树的指针,childPtr[0]...childPtr[numOfKey]
    int *key;//指向关键字数组的指针
};

在有限内存的情况下,每一次磁盘的访问我们都可以获得最大数量的数据。由于B树每结点可以具有比二叉树多得多的元素,所以与二叉树的操作不同,它们减少了必须访问结点和数据块的数量,从而提高了性能。
可以说,B树的数据结构就是为内外存的数据交互准备的。

在一个典型的B树应用中,要处理的硬盘数据量很大,因此无法一次全部装入内存。因此我们会对B树进行调整,使得B树的阶数(或结点的元素)与硬盘存储的页面大小相匹配。比如一棵B树的阶为1001(级一个结点包含1000个关键字),高度为2,它可以存储超过10亿个关键字,我们只要让根结点持久地保留在内存中,那么在这棵树上,寻找某一个关键字至多需要两次硬盘的读取即可。

B树的缺陷:
在B树中,当我们通过中序遍历来顺序查找树中的元素,假设每个结点都属于硬盘的不同页面,页面2-页面1-页面3-页面1-页面4-页面1-页面5。而且我们每次经过结点遍历时,都会对结点中的元素进行一次遍历,这就非常糟糕。
有没有可能让遍历时每个元素只访问一次呢?
这就是B+树。

B+树

B+ 树是一种树数据结构,是一个n叉排序树每个节点通常有多个孩子一棵B+树包含根节点、内部节点和叶子节点根节点可能是一个叶子节点,也可能是一个包含两个或两个以上孩子节点的节点

有n棵子树的结点中包含n个关键字
所有的叶子结点包含全部的关键字信息,及指向含这些关键字记录的指针,叶子结点本身依关键字的大小自小而大顺序链接。

这样的数据结构最大的好处就在于,如果是要随机查找,我们就从根结点出发,与B树的查找方式相同,只不过即使在分支结点找到了待查找的关键字,它也只是用来索引的,不能提供实际记录的访问,还是需要到达包含此关键字的终端结点。

如果我们是需要从最小关键字进行从小到大的顺序查找,我们就可以从最左侧的叶子结点出发,不经过分支结点,而是沿着指向下一个叶子的指针就可遍历所有的关键字。

B+树的结构特别适合带有范围的查找,比如查找我们学校18-22岁的学生人数,我们可以通过从根结点出发找到第一个18岁的学生,然后再在叶子结点按顺序查找到符合范围的所有记录。

B+树的插入,删除过程也都和B树类似,只不过插入和删除的元素都是在叶子结点上进行而已。

### 不同类型结构的特点与区别 #### 二叉特点 一棵空,或者是具有特定性质的二叉:如果左子非空,则左子上所有结点的值均小于根结点的值;若右子非空,则右子上所有结点的值均大于根结点的值。而且,左、右子也各自构成二叉排序[^2]。 #### 红黑树特性 红黑树是一种自平衡二叉搜索,在保持基本二叉搜索特性的基础上引入了颜色标记(红色或黑色),并通过一系列严格规定来确保任何路径从根到叶节点所经过的黑色节点数目相同,以此维持近似平衡状态,从而保障操作时间复杂度接近对数级O(log N)[^1]。 #### B特征 作为一种多路查找树,B通过允许每个内部节点拥有多个键值以及两个以上的孩子节点实现了更高效的磁盘读写优化。具体而言,B能够保证任意一条由根至叶子节点路径上的节点数量大致相等,并且支持动态调整以维护这种平衡性,进而使各种操作的时间复杂度稳定在O(log N)范围内[^4]。 #### B+特色 作为B的一种变体,B+不仅继承了前者的优势,还进一步改进了范围查询性能——所有的关键字存储在叶子层中形成有序链表连接起来,这使得区间扫描变得非常高效。此外,由于非叶子节点仅保存用于索引引导的信息而不含实际数据项,因此可以容纳更多指针指向其他下一层节点,提高了扇出率并减少了访问次数。 ```python class Node: def __init__(self, value=None): self.value = value self.left_child = None self.right_child = None def insert(root, key): if not root: return Node(key) elif key < root.value: root.left_child = insert(root.left_child, key) else: root.right_child = insert(root.right_child, key) # Code continues with balancing logic... ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值