什么是聚簇索引和覆盖索引？

最新推荐文章于 2025-10-06 15:12:07 发布

原创最新推荐文章于 2025-10-06 15:12:07 发布 · 1.1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#MySQL

+读书笔记专栏收录该内容

10 篇文章

订阅专栏

本文深入探讨了聚簇索引和覆盖索引的概念，分析了它们在数据存储和查询性能上的优缺点。聚簇索引将数据按索引顺序存储，加快访问速度但可能影响插入效率；覆盖索引则包含所有查询字段，减少数据访问量，提升查询性能。

这几天的任务就是学习索引，对于几种索引一直区分不太开，最近认真地阅读了《高性能MySQL》第五章创建高性能的索引的内容，打算把一些知识点记录下来，当然还有很多的坑，希望以后慢慢的填满吧。上一篇博客主要介绍了B+Tree索引和哈希索引，接下来准备介绍聚簇索引和覆盖索引。

聚簇索引

聚簇索引并不是一种单独的索引类型，而是一种数据存储方式。具体的细节依赖于其实现方式，但InnoDB的聚簇索引实际上在同一个结构中保存了B+Tree索引和数据行。当表有聚簇索引时，它的数据行实际上存放在索引的叶子页中。“聚簇”表示数据行和相邻的键值紧紧地存储在一起。一些数据库服务器允许选择哪个索引作为聚簇索引，InnoDB将通过主键聚集数据，如果没有定义主键，InnoDB会选择一个唯一的非空索引代替。如果没有这样的索引，InnoDB会隐式定义一个主键来作为聚簇索引。

聚簇索引的优点：

可以把相关数据保存在一起。
·数据访问更快。
·使用覆盖索引扫描的查询可以直接使用页节点中的主键值。

聚簇索引的缺点：

如果数据全部放在内存中，则访问的顺序就没那么重要了，聚簇索引没什么优势。
插入速度严重依赖于插入顺序。按照主键的顺序插入是加载到InnoDB表中速度最快的方式。如果不是按照主键顺序加载数据，那么在加载后最好使用OPTIMIZE TABLE命令重新组织一下表。
更新聚簇索引列的代价很高，因为会强制InnoDB将每个被更新的行移动到新的位置。
基于聚簇索引的表在插入新行，或者主键被更新导致需要移动行的时候，可能面临“页分裂”的问题。
聚簇索引可能导致全表扫描变慢，尤其是行比较稀疏，或者由于页分裂导致数据存储不连续的时候。
二级索引可能比想象的要更大，因为在二级索引的叶子节点中包含了引用行的主键列。
二级索引访问需要两次索引查找，而不是一次。

覆盖索引

一个索引包含了所有需要查询的字段的值，称之为“覆盖索引”。覆盖索引查询无须回表，能极大地提高性能

索引条目通常远小于数据行大小，所以如果只需要读取索引，那么MySQL就会极大地减少数据访问量。
因为索引是按照列值的顺序存储的，所以对于I/O密集型的范围查询会比随机从磁盘中读取每一行数据的I/O要少的多。
一些存储引擎如MyISAM在内存中只缓存索引，数据则依赖于操作系统来缓存，因此访问数据需要一次系统调用。这可能会导致严重的性能问题，尤其是那么系统调用占了数据访问中的最大开销的场景。
由于InnoDB的聚簇索引，覆盖索引对InnoDB表特别有用。InnoDB的二级索引在叶子节点中保存了行的主键值，所以如果二级主键能够覆盖查询，则可以避免对主键索引的二次查询。
不是所有类型的索引都可以成为覆盖索引。覆盖索引必须要存储索引列的值，而哈希索引、空间索引和全文索引等都不存储索引列的值，所以MySQL只能使用B-Tree索引做覆盖索引。
当发起一个被覆盖的索引时，在EXPLAIN的Extra列可以看到“using index”的信息。