什么是聚簇索引和覆盖索引?

本文深入探讨了聚簇索引和覆盖索引的概念,分析了它们在数据存储和查询性能上的优缺点。聚簇索引将数据按索引顺序存储,加快访问速度但可能影响插入效率;覆盖索引则包含所有查询字段,减少数据访问量,提升查询性能。

这几天的任务就是学习索引,对于几种索引一直区分不太开,最近认真地阅读了《高性能MySQL》第五章创建高性能的索引的内容,打算把一些知识点记录下来,当然还有很多的坑,希望以后慢慢的填满吧。上一篇博客主要介绍了B+Tree索引和哈希索引,接下来准备介绍聚簇索引和覆盖索引。

 

聚簇索引

聚簇索引并不是一种单独的索引类型,而是一种数据存储方式。具体的细节依赖于其实现方式,但InnoDB的聚簇索引实际上在同一个结构中保存了B+Tree索引和数据行。当表有聚簇索引时,它的数据行实际上存放在索引的叶子页中。“聚簇”表示数据行和相邻的键值紧紧地存储在一起。一些数据库服务器允许选择哪个索引作为聚簇索引,InnoDB将通过主键聚集数据,如果没有定义主键,InnoDB会选择一个唯一的非空索引代替。如果没有这样的索引,InnoDB会隐式定义一个主键来作为聚簇索引。

聚簇索引的优点:

  • 可以把相关数据保存在一起。
  • ·数据访问更快。
  • ·使用覆盖索引扫描的查询可以直接使用页节点中的主键值。

聚簇索引的缺点:

  • 如果数据全部放在内存中,则访问的顺序就没那么重要了,聚簇索引没什么优势。
  • 插入速度严重依赖于插入顺序。按照主键的顺序插入是加载到InnoDB表中速度最快的方式。如果不是按照主键顺序加载数据,那么在加载后最好使用OPTIMIZE TABLE命令重新组织一下表。
  • 更新聚簇索引列的代价很高,因为会强制InnoDB将每个被更新的行移动到新的位置。
  • 基于聚簇索引的表在插入新行,或者主键被更新导致需要移动行的时候,可能面临“页分裂”的问题。
  • 聚簇索引可能导致全表扫描变慢,尤其是行比较稀疏,或者由于页分裂导致数据存储不连续的时候。
  • 二级索引可能比想象的要更大,因为在二级索引的叶子节点中包含了引用行的主键列。
  • 二级索引访问需要两次索引查找,而不是一次。

 

覆盖索引

一个索引包含了所有需要查询的字段的值,称之为“覆盖索引”。覆盖索引查询无须回表,能极大地提高性能

 

  • 索引条目通常远小于数据行大小,所以如果只需要读取索引,那么MySQL就会极大地减少数据访问量。
  • 因为索引是按照列值的顺序存储的,所以对于I/O密集型的范围查询会比随机从磁盘中读取每一行数据的I/O要少的多。
  • 一些存储引擎如MyISAM在内存中只缓存索引,数据则依赖于操作系统来缓存,因此访问数据需要一次系统调用。这可能会导致严重的性能问题,尤其是那么系统调用占了数据访问中的最大开销的场景。
  • 由于InnoDB的聚簇索引,覆盖索引对InnoDB表特别有用。InnoDB的二级索引在叶子节点中保存了行的主键值,所以如果二级主键能够覆盖查询,则可以避免对主键索引的二次查询。
  • 不是所有类型的索引都可以成为覆盖索引。覆盖索引必须要存储索引列的值,而哈希索引、空间索引和全文索引等都不存储索引列的值,所以MySQL只能使用B-Tree索引做覆盖索引
  • 当发起一个被覆盖的索引时,在EXPLAIN的Extra列可以看到“using index”的信息。

 

 

### 定义 索引是一种特殊的索引类型,它决定了表中数据的物理存储顺序。具体来说,在具有索引的情况下,表中的行会按照索引键值的逻辑顺序进行物理存储[^2]。 非索引则不改变表中实际数据的物理存储顺序。它的叶子节点并不包含完整的行数据,而是指向实际数据所在的物理位置的信息(如主键值或文件偏移量)。这种设计使得一个表可以拥有多个非索引[^1]。 --- ### 工作原理 #### 索引的工作原理 当创建了一个索引时,数据库引擎会对整个表的数据重新排序,使其与索引键值保持一致。这意味着查找某个特定范围内的数据变得非常高效,因为这些数据在物理上是连续存储的。例如,如果查询的是某一段日期范围内的记录,那么一旦找到了起始记录的位置,就可以快速访问后续的相关记录而不需要额外的随机读取操作[^3]。 #### 非索引的工作原理 相比之下,非索引不会影响底层数据的实际布局。其主要作用是用来加速某些字段上的查询过程。在这种情况下,当通过非索引来定位目标数据时,通常还需要经历一次“回表”的动作来获取完整的行信息。这是因为非索引仅保存了部分用于匹配的关键字以及对应的指针(通常是主键或其他唯一标识符),最终仍需借助此指针去查找到真正的数据所在之处。 --- ### 主要区别 | **特性** | **索引** | **非索引** | |------------------------|--------------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------| | **数据存储方式** | 表中数据按索引键值的逻辑顺序进行物理存储 | 不改变表中实际数据的物理存储顺序 | | **数量限制** | 每张表最多只能有一个索引 | 可以为同一张表建立多个非索引 | | **适用场景** | - 经常涉及范围查询<br>- 排序需求较高的列 | - 复杂条件过滤<br>- 利用覆盖索引减少回表 | | **性能特点** | 对于范围扫描基于主键的精确查询效率高 | 查询速度取决于是否能实现索引覆盖;否则可能增加回表次数 | --- ### 示例代码展示 以下是两种索引类型的简单 SQL 创建语句: ```sql -- 创建索引 (InnoDB 默认为主键创建索引) CREATE TABLE users ( id INT PRIMARY KEY AUTO_INCREMENT, name VARCHAR(50), age INT, created_at DATETIME ) ENGINE=Innodb; -- 显示当前表结构及其索引情况 SHOW INDEX FROM users; ``` 对于非索引的例子如下所示: ```sql -- 添加一个新的非索引到 'age' 字段上 ALTER TABLE users ADD INDEX idx_age (age); ``` 以上例子展示了如何分别设置默认的索引手动添加辅助性的非索引。 ---
评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值