数据库-索引及其数据结构

最新推荐文章于 2025-06-25 17:09:34 发布

原创最新推荐文章于 2025-06-25 17:09:34 发布 · 522 阅读

CC 4.0 BY-SA版权

10 篇文章

订阅专栏

本文介绍了MySQL索引的本质，是帮助高效获取数据的排好序的数据结构。详细阐述了B-Tree和B+Tree的特点及差异，还分析了MyISAM和InnoDB的索引实现方式，重点探讨了InnoDB索引性能，如使用磁盘I/O次数评价优劣，利用预读和局部性原理优化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

索引是帮助MySQL高效获取数据的排好序的数据结构。

索引存储在文件里(硬盘里)
索引结构

1970年，R.Bayer和E.mccreight提出了一种适用于外查找的树，它是一种平衡的多叉树，称为B树（或B-树、B_树）。
一棵m阶B树(balanced tree of order m)是一棵平衡的m路搜索树。

它或者是空树，或者是满足下列性质的树：

是一种多路搜索树（并不是二叉的）：

定义任意非叶子结点最多只有M个儿子；且M>2；
根结点的儿子数为[2, M]；
除根结点以外的非叶子结点的儿子数为[M/2, M]；
每个结点存放至少M/2-1（取上整）和至多M-1个关键字；（至少2个关键字）
非叶子结点的关键字个数=指向儿子的指针个数-1；
非叶子结点的关键字：K[1], K[2], …, K[M-1]；且K[i] < K[i+1]；
非叶子结点的指针：P[1], P[2], …, P[M]；其中P[1]指向关键字小于K[1]的
子树，P[M]指向关键字大于K[M-1]的子树，其它P[i]指向关键字属于(K[i-1], K[i])的子树；
所有叶子结点位于同一层；
如：（M=3）

B+树是应文件系统所需而出的一种B-树的变型树。

有n棵子树的结点中含有n个关键字，每个关键字不保存数据，只用来索引，所有数据都保存在叶子节点。
所有的叶子结点中包含了全部关键字的信息，及指向含这些关键字记录的指针，且叶子结点本身依关键字的大小自小而大顺序链接。
所有的非终端结点可以看成是索引部分，结点中仅含其子树（根结点）中的最大（或最小）关键字。
通常在B+树上有两个头指针，一个指向根结点，一个指向关键字最小的叶子结点。

数据文件本身就是B+Tree组织的一个索引结构文件（.frm结构文件和.idb数据和索引文件）
聚集索引-叶节点包含了完整的数据记录
为什么InnoDB表必须有主键，并且推荐使用整型的自增主键？
数据文件本身就是B+Tree组织的一个索引结构文件,主键索引就是聚集索引，不建默认自动建索引。用字符串不如整型比较快，字符串需要先转成ASCII，整型省空间，int占32位。不可用UUID,因为UUID不一定自增，可能造成B+Tree分裂。
为什么非主键索引结构叶子节点存储的是主键值？（一致性和节省存储空间）

主键索引与非主键索引有区别：
聚集索引通常就是主键索引

辅助索引就是非聚集索引，只包含索引列和一个用于查找对应行记录的『书签』
在这里插入图片描述
B+Tree节点中关键字冗余问题?