B树

             (1)B树应用

                      1> 常用作数据库的索引。

                      2>因为大量数据存储在磁盘中,所以io次数就成为了评价索引结构的优劣。从B-Tree分析,可知检索一次最多要访问树高h-1个节点(因为根节点常驻内存),所以复杂度为O(h)=O(logN),底数m为B-Tree的叉,通常非常大,超过100,所以h非常小,通常不超过3,所以只需3次IO就可以实现查找,效率是非常高的(注意此处说3次io的前提是:将节点设置为1个页面大小,否则会导致调入一个节点多次io)

                      3>与红黑树比较

                           因为具有相同数量节点N的情况下,红黑树的高度明显要比B-tree高,所以效率明显比B-tree差很多

             (2)B树定义

                      1> 核心定义:

                           1.定义一条记录是一个二元组[key,data],key为作为索引的列的值,对于不同记录,key互不相同;data是该条记录的其他数据

                           2.每个非叶子节点由n-1个key和n个指针组成

                           3.每个叶子节点的指针均为空,最少包含一个key

                           4.所有叶子节点在同一深度

                           5.每个指针要么为空,要么指向另一个节点。

                                  如果某个指针在节点node的最左边且不为null,则其指向的节点中所有的key均小于node的第一个key的值

                                  如果某个指针在节点node的最右边且不为null,则其指向的节点中所有的key均大于node的最后一个key的值

                                  如果某个指针在节点node的左右相邻key为key1和key2且不为null,则其指向节点的所有key均大于key1,小于key2

                                    

                      2> 严格定义(m阶B树):

                           1.树中每个节点最多含有m个孩子(m>=2)

                           2.除了根节点和叶子节点以外,其他每个节点至少有ceil(m/2)个孩子,最多m-1个(如m=5,那么至少有3个孩子,最多4个)

                           3.根节点至少有2个孩子

                           4.所有叶子节点都出现在同一层,叶子节点不包含任何信息,相当于查询失败节点

                           5.每个非终端节点包含n个关键字:(n,p0,k1,p1,k2,p2.......kn,pn)

                               ki为关键字,且关键字按顺序升序排列ki-1 < ki

                               pi为指向子树的节点,指针pi-1指向子树中的所有节点的关键字均大于ki-1,小于ki

                              

             (3)B树查找

                             由于B-tree的特性,在B-tree中按key检索数据的算法非常直观:首先从根节点进行二分查找,如果找到则返回对应节点的data,否则根据指针递归查找对应区间的节点,知道找到节点或找到null指针,前者表示查找成功,后者表示查找失败。



             (4)B树深度

                             目标为m阶B-tree,那么每个非根节点的度最大为 t = ceil(m/2),那么就有

                       






### B数据结构实现 B一种自平衡的搜索,广泛应用于数据库文件系统中。其设计目的是为了减少磁盘访问次数,提高数据检索效率。B的每个节点可以包含多个关键字子节点指针,且所有叶子节点位于同一层。 #### 1. B的基本定义 B由节点组成,每个节点包含一组关键字一组子节点指针。对于一个最小度数为 \(t\) 的B,有以下特性[^2]: - 每个节点最多包含 \(2t-1\) 个关键字。 - 根节点至少包含一个关键字。 - 非根节点至少包含 \(t-1\) 个关键字。 - 如果某个节点是非叶子节点,则它包含 \(n\) 个关键字 \(n+1\) 个子节点指针,其中 \(t \leq n \leq 2t-1\)。 - 所有叶子节点都在同一层。 #### 2. B节点的结构 在代码实现中,B的节点通常定义如下[^2]: ```c typedef int KEY_VALUE; typedef struct _btree_node { KEY_VALUE *keys; // 关键字数组 struct _btree_node **childrens; // 子节点指针数组 int num; // 当前节点的关键字数量 int leaf; // 是否为叶子节点 } btree_node; ``` #### 3. B的操作 B的主要操作包括插入、删除查找。以下是这些操作的基本描述: ##### (1) 插入操作 当向B中插入一个新关键字时,可能需要分裂节点以保持的平衡。具体步骤如下: - 如果根节点满,则创建一个新的根节点,并将原根节点作为其子节点。 - 自顶向下查找合适的位置插入关键字。 - 如果某节点已满,则将其分裂为两个节点,并将中间关键字上移至父节点。 ##### (2) 删除操作 删除关键字时,可能需要合并或重新分配节点中的关键字以保持的平衡。具体步骤如下: - 查找待删除的关键字。 - 如果关键字存在于非叶子节点,则用其前驱或后继替换该关键字。 - 如果删除导致某节点的关键字数量低于下限,则从兄弟节点借关键字,或兄弟节点合并。 ##### (3) 查找操作 查找操作通过比较关键字节点中的值,逐步缩小搜索范围。具体步骤如下: - 从根节点开始,逐层向下查找。 - 在当前节点中查找目标关键字,如果找到则返回;否则进入相应的子节点继续查找。 #### 4. 示例代码 以下是一个简单的B插入操作的伪代码示例: ```c void btree_insert_nonfull(btree_node *node, KEY_VALUE key) { int i = node->num - 1; if (node->leaf) { // 如果是叶子节点 while (i >= 0 && node->keys[i] > key) { node->keys[i + 1] = node->keys[i]; i--; } node->keys[i + 1] = key; node->num++; } else { // 如果是非叶子节点 while (i >= 0 && node->keys[i] > key) { i--; } i++; if (node->childrens[i]->num == 2 * t - 1) { // 如果子节点已满 split_child(node, i); if (key > node->keys[i]) { i++; } } btree_insert_nonfull(node->childrens[i], key); } } ``` #### 5. BB+的对比 尽管B功能强大,但在实际应用中,B+更为常用。B+对B进行了优化,主要改进点包括[^1]: - 所有关键字都存储在叶子节点中,便于范围查询。 - 叶子节点之间通过链表连接,支持顺序访问。 - 非叶子节点仅用于索引,不存储实际数据。 ### 总结 B一种高效的多路平衡搜索,适用于大规模数据存储检索场景。其核心在于通过节点分裂合并保持的平衡性,从而确保操作的时间复杂度为 \(O(\log n)\)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值