10/21 关于B树

最新推荐文章于 2025-11-06 16:41:07 发布

原创最新推荐文章于 2025-11-06 16:41:07 发布 · 253 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#B树

C++ 同时被 2 个专栏收录

12 篇文章

订阅专栏

数据结构

7 篇文章

订阅专栏

本文详细解析了M阶B树的结构特性，包括根节点与非树叶节点的儿子数范围，以及所有树叶处于同一深度的特点。通过数学推导，估计了关键字数目为N时，B树高度的上界为log(n)(N+1)，并提供了详细的计算过程。

注意：首先需要说明的一点是：B-树就是B树，没有所谓的B减树

M阶的B-tree是一棵具有下列结构特性的树：
（1）树的根或者是一片树叶，或者其儿子树在2到M之间。
（2）除根外，所有非树叶节点的儿子数在[M/2]到M之间。(符号[]表示向上取整)
（3）所有树叶都在相同的深度上。

问题：
For a B-tree of order m, estimate an upper bound for the height in terms of the number of keys N. Show your reasons, not just the bound.
对于一个m阶的B树，在关键字数目为N的情况下，估计它高度的上界。
说出你的理由，不止是边界。

解:
设高度为h
每个结点的最小关键字数为上取整（m/2）-1
每个结点的最少结点数是 : n=上取整（m/2）-1+1= 上取整（m/2）
已知关键字数 N。
关键字总数 N= (n-1)(1+n¹+n²+…+n^h)=(n-1)(1-n^h)/(1-n)=n^h-1
可得h最大为log(n)(N+1)，即log(n)(N+1)为h的上界。

参考：
在这里插入图片描述

解：
每次从磁盘读取数据花费时间 t = a + bd;
a,b是常数，d是树的阶。
n是B树的元素总数。
B树进行操作花费的时间 T = 树的高度 × t；
问题转化为求树的高度。
设树高为h.
①每个结点最少元素数 = 上取整（d/2）- 1;
每个结点最少孩子数 k = 上取整（d/2）;
此时n = (k-1)(1+k¹+k²+…+k^h)= k^h-1
h <= log(上取整(d/2)) (n+1) ->O(log (d)(n))
②每个结点最多元素数 m - 1;
每个结点最多孩子数 m
此时n = (d-1)(1+d¹+d²+…+d^h)=d^h-1;
h>=log(d)(n+1); ->O(log(d)(n))