mysql聚簇索引和非聚簇索引

最新推荐文章于 2025-05-04 10:05:46 发布

zhulijunyou

最新推荐文章于 2025-05-04 10:05:46 发布

阅读量1k

点赞数 19

文章标签： mysql 数据库

本文链接：https://blog.youkuaiyun.com/zhulijunyou/article/details/134598975

版权

文章探讨了内存与磁盘I/O的关系，重点介绍了数据库中的聚簇索引和非聚簇索引，解释了它们的物理存储、更新操作影响以及查询性能差异。通过优化I/O操作和利用多叉树结构提升查询效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

计算机对内存比磁盘的读写速度要快很多，但内存容量要远小于磁盘，而数据、程序的执行要调入内存后才能执行，所以内存和磁盘要经常进行I/O操作，I/O操作是个费事的过程，虽然现代系统已经有了通道（I/O处理机）技术的支持，但这远远不够（CPU的处理速度远远大于磁盘I/O的速度）

当计算机需要读取磁盘数据时，首先会检查磁盘缓存中是否已经存在所需数据，如果存在，则直接从缓存中读取数据，避免磁盘寻道时间的浪费。如果缓存中不存在所需的数据，则会从磁盘中读取，并将相邻的数据一起预读到缓存中，已备后续使用。聚簇索引利用这个原理，尽可能多的利用磁盘的IO，让一次IO能够获取更多的有效数据

mysql索引按照物理分类可分为聚簇索引和非聚簇索引

聚簇索引

将数据存储与索引放到了一块，找到索引也就找到了数据，索引结构的叶子节点保存了行数据（一个表中只有一个聚簇索引）。

在Innodb引擎中，聚簇索引默认就是主键索引，如果表中没有定义主键，那么该表的第一个唯一非空索引被作为聚集索引。如果没有主键也没有合适的唯一索引，那么innodb内部会生成一个隐藏的主键作为聚集索引，这个隐藏的主键是一个6个字节的列，改列的值会随着数据的插入自增。查询数据时，要先把磁盘中的数据加载到内存里，然后再经过逻辑处理，返回给用户结果。其中磁盘IO操作是非常耗时的，我们查询效率的重点就是尽量减少磁盘IO操作。

InnoDB引擎一次IO会读取的一页数据（page 默认一页16K），而二叉树一次IO有效数据量只有16字节，空间利用率极低。为了最大化利用一次IO空间，一个简单的想法是在每个节点存储多个元素，在每个节点尽可能多的存储数据。每个节点可以存储1000个索引（16k/16=1000），这样就将二叉树改造成了多叉树，通过增加树的叉树，将树从高瘦变为矮胖。构建1百万条数据，树的高度只需要2层就可以（1000*1000=1百万），也就是说只需要2次磁盘IO就可以查询到数据。磁盘IO次数变少了，查询数据的效率也就提高了。