前言
B树基本规则
-
每个节点最多有m个子节点,其中m是一个正整数。根节点除外,其他节点至少有⌈m/2⌉个子节点。
-
每个节点中的键值按照非降序排列。对于节点中的键值k,如果有n个子节点,那么节点中的n-1个键值将把节点分为n个区间,第i个区间的键值小于k,第i+1个区间的键值大于等于k。
-
所有叶子节点位于同一层,且不包含任何键值信息,可以看作是外部存储的块。
-
每个非叶子节点中的键值个数比子节点个数少1。
-
每个节点中的键值个数满足:
⌈m/2⌉-1 <= 键值个数 <= m-1
B树的数据插入(文字描述+图解)
插入规则概览:
1.从根节点开始,按照节点中的键值进行比较,找到合适的叶子节点(比较结果类似于二叉搜索树)。
2.如果叶子节点中已经存在该键值,则更新相应的值。
3.如果叶子节点中不存在该键值,则将键值插入到叶子节点的合适位置,并保持节点中的键值有序。
4.如果插入键值后,叶子节点的键值个数超过了上限m-1,则进行分裂操作。
将叶子节点的键值分成两部分,左边部分包含⌈(m-1)/2⌉个键值,右边部分包含⌊(m-1)/2⌋个键值。
将右边部分的键值和对应的子节点分离出来,形成一个新的叶子节点。
将新的叶子节点插入到叶子节点的右边,并更新父节点的键值信息。
5.如果插入键值后,叶子节点的键值个数没有超过上限m-1,则直接插入。
6.如果父节点存在并且插入键值后超过了上限m-1,则进行分裂操作。
将父节点的键值分成两部分,左边部分包含⌈(m-1)/2⌉个键值,右边部分包含⌊(m-1)/2⌋个键值。
将右边部分的键值和对应的子节点分离出来,形成一个新的父节点。
将新的父节点插入到父节点的右边,并更新祖父节点的键值信息。
重复步骤6,直到根节点为止。
(图解)插入的情况归类为以下几种:
-
无父亲节点,不需要分裂;
-
有父亲节点,不需要分裂;