Mysql探秘之索引
引言
正确的创建合适的索引
是提升数据库性能查询的基础
索引的定义
索引是为了加速对表中数据行的检索而创建的一种分散存储的数据结构
为什么要用索引
索引能极大的减少存储引擎需要扫描的数据量
索引可以把随机IO变成顺序IO
索引可以帮助我们在进行分组、排序等操作时,避免使用临时表
为什么选择B+Tree
二叉查找树,Binary Search Tree
二叉查找树又有一个缺点,例如下图
这种的也是二叉查找树,由于分布的不均匀,导致程线性列表的存在,如果用二叉查找树来作为索引的话,还是有不足的,因此引出下一个数据结构
平衡二叉树
【完全平衡二叉树的定义:整颗数的高度差都不会超过1】
【平衡二叉树的定义:某一个节点的高度差不会超过1】
缺点
太深了
数据处的(高)深度决定着它的IO操作次数,IO操作耗时大
太小了
每一个磁盘块(节点)保存的数据量太小了
没有很好的利用操作磁盘IO的数据交换性
也没有利用好磁盘IO的预读能力(空间局部性原理),从而带来了频繁的IO操作
B-Tree 多路平衡查找树
路 可以理解为箭头;多路代表是比二条路要多的;
关键字 : n-1 (n 代表就是路)
B+Tree 加强版多路平衡查找树
B+Tree 和 B-Tree的区别
- B+节点关键字搜索采用闭合区间
- B+非叶节点不保存数据相关信息,只保存关键字和子节点的引用
- B+关键字对应的数据保存在叶子节点中
- B+叶子节点是顺序排列的,并且相邻节点具有顺序引用的关系
为什么选用B+Tree作为Mysql的索引
- B+树是B-树的变种(PLUS版)多路绝对平衡查找树,拥有B-树的又是
- 扫库、表能力更强
- 磁盘读写能力更强
- 排序能力更强
- 查询效率更加稳定