什么是索引覆盖?回表?下推?为什么插入数据会造成页分裂?

1.索引数据结构

什么是索引?为什么索引可以加快查询?

索引的数据结构?

B+树和B树、红黑树有什么区别?为什么选择B+树,作为索引数据结构?

索引是一种能提高查询速度的数据结构。

MySQL有哪些索引类型?

  1. 按数据结构分类:B+树索引、Hash索引、全文索引。
  2. 按物理存储分类:聚簇索引、二级索引。
  3. 按字段特性分类:主键索引、唯一索引、普通索引、前缀索引。
  4. 按字段个数分类:单列索引、联合索引。

InnoDB的索引数据结构是什么?(InnoDB是支持B+树和FULLTEXT索引的)

在数据组织形式上,B+树的非叶子节点只存放索引和指向子节点的指针,叶子节点存储索引和行数据。并且所有叶子节点都是通过指针相连,形成一个双向链表,支持快速的顺序访问和范围查询。树的高度平衡,稳定性好。

B+树和B树有什么区别呢?

  • B树的每个节点都存有索引和数据,数据的分散可能导致查询性能不稳定,而B+树只有叶子节点存放索引和数据,更适合磁盘存储和范围查询,非叶子节点只需要存储索引,可以容纳更多的键值,减少磁盘IO操作。
  • B树每个节点之间没有双向链表连接,B+树节点之间有双向链表连接,在查询时无需返回到根节点,更加适合范围查询。
  • B树查询数据的时候使用中序遍历,有时需要多次磁盘IO,查询不稳定,B+树查询数据时,都需要从根节点到叶子节点,查询稳定。

1.1 为什么MySQL使用B+树?

平衡二叉树

红黑树

跳表

B+是多叉树,形状更加矮胖,每次查询数据时IO性能都差不多,但是二叉平衡树、红黑树都是二叉树,在数据很多的时候,高度很高,磁盘IO次数更多,而且还需要额外的执行平衡操作。

跳表需要更多的内存去维护多级索引,而且跳表在极端情况下会退化为单链表,平衡性差,而数据库查询需要一个稳定的查询时间。

B树的叶子节点和非叶子节点都存储了索引和数据,可能内存装不下,B+树的非叶子节点只有索引,而且节点之间也由双向链表连接,适合范围查询。

B+树

  • B+树是多叉树,在数据存储上,叶子节点存储索引和数据,非叶子节点存放索引和指向子节点的指针。
  • 节点之间都是由双向链表连接的,能够快速的进行顺序访问和范围查询。
  • 所有的叶子节点都是在同一层的,查询数据的时候有较好的稳定性,而且B+树大概都是34层,所需要的磁盘IO也就34次。

1.2 为什么不使用红黑树?B树?哈希表?

红黑树是二叉树在同等数据量的情况下,高度更高,那么在查询数据的时候就需要更多的磁盘IO次数;B树的索引和数据,都存储到节点中,叶子节点之间没有双向链表,那么范围查询就不太适合,要通过中序遍历查询性能差;哈希表不能进行范围查询和排序,如果存在重复的键值,还有可能造成哈希冲突。B+树的优点就是叶子节点之间通过了双向链表连接,有利于进行范围查询,但是在增加删除操作的时候,由于要进行树的合并分裂的调整操作,就会造成更多的随机IO操作,影响性能。

2.索引覆盖?回表?下推?

创建联合索引之后,进行查询时索引覆盖还是回表,主要是看SELECT的列。

注:以下采用sakila数据库做演示https://www.sjkjc.com/sakila/

EXPLAIN SELECT actor_id, last_name FROM actor WHERE last_name = 'WAHLBERG';

在这里插入图片描述

可以看到在Extra字段为using index,表示为索引覆盖。为什么呢?

因为触发索引覆盖的条件就是所要查询的字段为这个索引本身或主键值。如果有其他字段就需要就行回表查询。

EXPLAIN SELECT actor_id,first_name, last_name FROM actor WHERE last_name = 'WAHLBERG';

在这里插入图片描述

索引下推是MySQL5.6的优化机制,默认是开启的,如果条件判断字段,在二级索引B+树里,就会下推到InnoDB存储引擎层来过滤,过滤完的记录,才会回表,相比没有索引下推的时候,可以减少回表次数。

3.关于插入造成的页分裂

为什么会出现数据页的分裂呢?

如果使用非自增主键就比如使用uuid,那么每次插入数据的索引值都是随机的,那么就有可能插入其它的数据页。但是使用自增主键的话,会进行顺序递增依次将数据插入到叶子节点最右边的节点里,除非页满了,否则不会调整页面,那么就能更高效的使用数据页。

就比如一个数据页里的主键数据(这里表示主键不是递增顺序)如下,

此时,我在添加一个新的数据,主键为3,那么就会进行调整数据,进行分页合并等操作。

所以,在设计数据表的时候最好设计为自增主键。

参考资料

1、https://xiaolincoding.com/mysql/index/why_index_chose_bpuls_tree.html#%E6%80%8E%E6%A0%B7%E7%9A%84%E7%B4%A2%E5%BC%95%E7%9A%84%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84%E6%98%AF%E5%A5%BD%E7%9A%84

2、https://developer.aliyun.com/article/1415520

3、https://blog.youkuaiyun.com/weixin_46204056/article/details/125595803

4、https://www.cnblogs.com/zhuchangwu/p/14041410.html
.youkuaiyun.com/weixin_46204056/article/details/125595803

4、https://www.cnblogs.com/zhuchangwu/p/14041410.html

原文链接:https://mp.weixin.qq.com/s/SDOxaQykyP7eU1GsBZ7jtg?token=1566802147&lang=zh_CN

### 答1: MySQL 之所以使用 B 树来实现索引,是因为 B 树具有很好的查询性能和可扩展性。 B 树能够在 logarithmic 的时间内完成查询,这使得它在处理大量数据时仍然保持较快的速度。在 B 树中,每个节点都包含若干个键值和指向其子节点的指针。查询时,可以从根节点开始,通过比较键值来确定应该查询哪个子节点,从而快速定位所需的数据。 B 树还具有很好的可扩展性,因为它允许动态地添加和删除节点。当数据量增加时,可以通过在 B 树中插入新节点来扩展索引。同时,B 树还具有自平衡的特性,能够保证树的高度在可接受的范围内,这使得查询的速度得到保障。 因此,MySQL 使用 B 树来实现索引,是因为它具有较高的查询性能和可扩展性,能够满足大多数场景下的需求。 ### 答2: MySQL索引使用B树的原因有以下几点: 1. 平衡二叉树:B树是一种平衡二叉树,节点的子树个数范围为[ceil(m/2),m],m为节点的最大子树个数,通常为2。通过保证树的平衡性,B树可以快速进行查找操作。 2. 数据的有序性:B树的特点是节点中的关键字有序排列,这样可以避免进行无谓的比较。在查找过程中,不需要遍历整个树,只需要通过比较当前节点的关键字和目标关键字的大小,就可以确定下一步的查找方向,从而加快搜索的速度。 3. 多级索引:B树是多级索引的基础,根节点存储的是子节点的指针,通过多级索引可以减少磁盘IO的操作。B树的高度相对较低,可以通过少量的磁盘IO就能访问到大量的数据。 4. 更新高效:B树的插入和删除操作相对高效。插入操作只需要找到插入位置,并将新节点插入到正确的位置,然后更新父节点的指针即可。删除操作类似,只需要找到要删除的节点,并更新相邻节点的指针即可。 由于B树具有平衡性、有序性、多级索引和高效的插入、删除操作,因此MySQL索引使用B树结构,并且能够提供快速的数据查找能力。同时,MySQL还结合其他优化技术如自适应哈希索引、覆盖索引等,进一步提升索引的查询性能。 ### 答3: MySQL 索引使用 B 树结构,并且执行速度很快的原因有以下几点。 首先,B 树是一种平衡多叉树,其每个节点可以包含多个键值对,这使得 B 树能够在读取和写入数据时都能够较少的访问磁盘。在数据库中,数据通常存储在磁盘上,而磁盘的读写速度较慢,因此减少磁盘访问次数可以提高查询速度。B 树通过将数据分散存储在不同的节点上,并采用适当的分裂和合并策略,以保持树的平衡,使得查询的访问路径较短,从而可以尽可能少地访问磁盘。 其次,B 树在结构上支持按照顺序访问数据。因为 B 树的节点按照键值有序排列,加上每个节点可以包含多个键值对,这使得在范围查询时可以以更加高效的方式访问数据。例如,当根据索引范围进行查询时,只需要找到范围的起始节点,然后按照顺序遍历即可,而不需要遍历所有数据。 另外,B 树还支持数据插入和删除操作,这对于索引的维护非常重要。当数据插入或者删除时,B 树可以通过分裂和合并节点来保持树的平衡。这样就不需要对整个树进行重新构建,从而提高索引的维护效率。 总而言之,MySQL 索引采用 B 树的数据结构,并且在查询、插入和删除操作中都能够保持较快的执行速度。B 树的平衡性、顺序性以及对插入和删除操作的高效支持,使得 B 树索引成为了数据库中广泛应用的一种索引结构。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大华Coding

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值