MySQL索引底层数据结构与算法

什么是索引

索引是排好序的数据结构,可以帮助 MySQL 高效查找数据。

索引的数据结构

索引底层的数据结构是 B+ 树。为什么使用 B+ 树?和 二叉树,红黑树,Hash,B 树相比较,B+ 树效率最高。

B+ 树

  • 节点中的数据从左到右递增排序

  • 叶子节点之间有链表连接

  • 只有叶子节点存储数据

二叉树,红黑树,Hash,B 树缺点

  • 二叉树的缺点是当主键列为整形自增的数据时,二叉树就是一列数据,查询效率不高。
  • 红黑树的缺点是当主键列为整形自增的数据时,在数据量大的时候根节点的右子树会很高,查找效率低。
  • Hash 的缺点是不能进行范围查找。
  • B 树的缺点是每个节点存储value值,相同高度下,B+ 树能存储更多的数据;叶子节点间没有连接,范围查找会比 B+ 树慢。

常用的存储引擎

InnoDB 存储引擎(聚集)

  • 所有数据信息都放在一个文件中。

  • 叶子节点存储的是主键对应的那一行的数据。

  • 非主键索引不是聚集索,叶子结点存储的是主键的值。

MyISAM 存储引擎(非聚集)

  • 索引文件和数据文件是分开存放的,索引文件叶子节点存储的是磁盘的物理地址。

  • 查询时要先查询索引文件,根据磁盘地址去数据文件中查找那一行数据。

联合索引(索引最左前缀原理)

当多个元素构成联合索引时,构建 B+ 树时会根据这几个元素进行排序,顺序是从左到右,只有两个元素相同时,才会比较后一个元素。

面试题

为什么索引最左前缀原理要从左边第一个元素开始比较?

因为构建 B+ 树时就是排好序的,如果从第二个元素开始比较,此时构建好的索引结构第二个元素再整体看来可能不是排好序的,这样查询需要遍历所有的数据。

为什么建议 InnoDB 表必须建主键,并且推荐使用整型的自增主键?

因为 InnoDB 表默认规定如果没有主键列,在已有的数据中查找一列没有重复元素的列进行索引的构建,如果没有主键列也没有一列的元素没有重复的,会自动生成一列隐藏数据进行索引的构建,既然如此,还是自己主动建主键效率会更高。

B+ 树的一个特点是节点中的数据从左到右递增排序,如果不使用自增的数据,构建索引的时候还要排序,影响效率;如果不使用整型而是字符串类型,那么在比较的时候效率肯定会比整型的慢,综合比较之下,还是自增的整型数据最合适。

为什么非主键索引叶子节点存储的是主键值?

一致性:当数据有了改变之后,都从主键索引读取数据可以保证一致性。

节约存储空间:如果有多个二级索引,每个二级索引都存放全部数据将会很浪费空间,使用这个办法就节约了存储空间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值