什么是索引
索引是排好序的数据结构,可以帮助 MySQL 高效查找数据。
索引的数据结构
索引底层的数据结构是 B+ 树。为什么使用 B+ 树?和 二叉树,红黑树,Hash,B 树相比较,B+ 树效率最高。
B+ 树
-
节点中的数据从左到右递增排序
-
叶子节点之间有链表连接
-
只有叶子节点存储数据
二叉树,红黑树,Hash,B 树缺点
- 二叉树的缺点是当主键列为整形自增的数据时,二叉树就是一列数据,查询效率不高。
- 红黑树的缺点是当主键列为整形自增的数据时,在数据量大的时候根节点的右子树会很高,查找效率低。
- Hash 的缺点是不能进行范围查找。
- B 树的缺点是每个节点存储value值,相同高度下,B+ 树能存储更多的数据;叶子节点间没有连接,范围查找会比 B+ 树慢。
常用的存储引擎
InnoDB 存储引擎(聚集)
-
所有数据信息都放在一个文件中。
-
叶子节点存储的是主键对应的那一行的数据。
- 非主键索引不是聚集索,叶子结点存储的是主键的值。
MyISAM 存储引擎(非聚集)
-
索引文件和数据文件是分开存放的,索引文件叶子节点存储的是磁盘的物理地址。
-
查询时要先查询索引文件,根据磁盘地址去数据文件中查找那一行数据。
联合索引(索引最左前缀原理)
当多个元素构成联合索引时,构建 B+ 树时会根据这几个元素进行排序,顺序是从左到右,只有两个元素相同时,才会比较后一个元素。
面试题
为什么索引最左前缀原理要从左边第一个元素开始比较?
因为构建 B+ 树时就是排好序的,如果从第二个元素开始比较,此时构建好的索引结构第二个元素再整体看来可能不是排好序的,这样查询需要遍历所有的数据。
为什么建议 InnoDB 表必须建主键,并且推荐使用整型的自增主键?
因为 InnoDB 表默认规定如果没有主键列,在已有的数据中查找一列没有重复元素的列进行索引的构建,如果没有主键列也没有一列的元素没有重复的,会自动生成一列隐藏数据进行索引的构建,既然如此,还是自己主动建主键效率会更高。
B+ 树的一个特点是节点中的数据从左到右递增排序,如果不使用自增的数据,构建索引的时候还要排序,影响效率;如果不使用整型而是字符串类型,那么在比较的时候效率肯定会比整型的慢,综合比较之下,还是自增的整型数据最合适。
为什么非主键索引叶子节点存储的是主键值?
一致性:当数据有了改变之后,都从主键索引读取数据可以保证一致性。
节约存储空间:如果有多个二级索引,每个二级索引都存放全部数据将会很浪费空间,使用这个办法就节约了存储空间。