mysql为什么要用b+树
先看原因:
1.B+树减少了IO次数,效率更高
(这里这么理解:-----就是减少了磁盘的访问次数,毕竟内存速度要比磁盘快的多)
2.B+树查询跟稳定,因为所有数据放在叶子节点
3.B+树范围查询更好,因为叶子节点指向下一个叶子结点
介绍
一般查询一堆数据会使用到的数据结构是:哈希表、B+树。mysql使用的是B+树。
B+树是通过二叉查找树,再由平衡二叉树(B-树)演变而来。
但B+树不是二叉树
科普:什么叫二叉树
- 叶节点最多拥有两个节点
- 叶节值于左边节点、于右边节点
- 没有值相等重复的节点;
二叉树如图:
比如:你想找到008,先和006比对,008大于006,则和007比对,一次类推。每一次比对都能排除一半的数据,是不是效率比较高。
既然二叉树查询效率比较高,那为啥还需引进平衡二叉树呢?
那是因为二叉树会有一种极端的情况:
这个也是满足二叉树的极端情况,你想找到0008的,则必须经过4次比对。效率低下!
平衡二叉树则是在二叉树的条件下多了一个限制条件:树的左右两边的层级数相差不会于1
这样就不会让二叉树处于一条线的极端情况了。
平衡叉树的查找效率确实很快,但维护颗平衡叉树的代价是常的,需要1次或多次左旋和右旋来得到插
或更新后树的平衡性。
那么又问题来了