转自 : https://blog.youkuaiyun.com/ithomer/article/details/5658306
B树: 二叉搜索树
1.所有非叶子结点至多拥有两个儿子(Left和Right);
2.所有结点存储一个关键字;
3.非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树
B- 树: 多路搜索树(并不是二叉的)
B- 树的搜索,从根 结点开始,对结点内的关键字(有序)序列进行二分查找,如果命中则结束,
否则进入查询关键字所属范围的儿子结点;重复,直到所对应的儿子指针为空,或已经 是叶子结点;
B- 树 的特性:
1. 关键字集合分布在整颗树中;
2. 任何一个关键字出现且只出现在一个结点中;
3. 搜索有可能在非叶子结点结束;
4. 其搜索性能等价于在关键字全集内做一次二分查找;
5. 自动层次控制;
B+ 树 的特性:
1. 所有关键字都出现在叶子结点的链表中(稠密索引),且链表中的关键字恰好是有序的;
2. 不可能在非叶子结点命中;
3. 非叶子结点相当于是叶子结点的索引(稀疏索引),叶子结点相当于是存储(关键字)数据的数据层;
4. 为所有叶子结点增加一个链指针;
5. 所有关键字都在叶子结点出现;
6. 非叶子结点的子树指针与关键字个数相同
7. 更适合文件索引系统;
B* 树
是 B+ 树的变体,在 B+ 树的非根和非叶子结点再增加指向兄弟的指针;
B* 树定义了非叶子结点关键字个数至少为 (2/3)*M ,即块的最低使用率为 2/3 (代替 B+ 树的 1/2 );
B+ 树的分裂:
当一个结点满时,分配一个新的结点,并将原结点中 1/2 的数据复制到新结点,最后在父结点中增加新结点的指针;
B+ 树的分裂只影响原结点和父结点,而不会影响兄弟结点,所以它不需要指向兄弟的指针;
B* 树的分裂:
当一个结点满时,如果它的下一个兄弟结点未满,那么将一部分数据移到兄弟结点中,再在原 结点插入关键字,
最后修改父结点中兄弟结点的关键字(因为兄弟结点的关键字范围改变了);
如果兄弟也满了,则在原结点与兄弟结点之间增加新结点,
并各复制 1/3 的数据到新结点,最后在父结点增加新结点的指针;
所以, B* 树分配新结点的概率比 B+ 树要低,空间使用率更高;
小结
B 树:二叉树,每个结点只存储一个关键字,等于则命中,小于走左结点,大于走右结点;
B- 树:多路搜索树,每个结点存储 M/2 到 M 个关键字,非叶子结点存储指向关键字范围的子结点;
所有关键字在整颗树中出现,且只出现一次,非叶子结点可以命中;
B+ 树:在 B- 树基础上,为叶子结点增加链 表指针,所有关键字都在叶子结点中出现,非叶子结点作为叶子结点的索引;
B+ 树总 是到叶子结点才命中;
B* 树:在 B+ 树基础上,为非叶子结点也增 加链表指针,将结点的最低利用率从 1/2 提高到 2/3 ;