定位根节点
B+树的查询从根节点开始。根节点的位置是固定的(存储在系统表或内存中)。
缓存优化:若根节点在缓存池(Buffer pool)中,直接内存读取;否则出发磁盘I/O。
逐层向下查找
键值比较与二分查找:
在每一层节点中,通过二分查找确定下一个子节点。 如:节点键值{10,20,30},
Id = 5时, 选择第一个子节点 5 < 10。
到达叶子节点
聚簇索引:叶子节点包含完整的数据行。
二级索引:叶子节点存储主键值,需要回表查询主键主键索引获取真实数据。
叶子节点内部查找
-
- 物理存储格式:
- 所有键值(Key)按主键顺序紧密排列(聚簇索引)或按索引字段顺序排列(二级索引)。
- 每个键值关联数据行指针(聚簇索引)或主键值+数据行指针(二级索引)。
- 单个叶子节点大小与磁盘页对齐(默认16KB),存储上百条记录。
- 逻辑结构:| 键值1 | 数据指针/主键值 | → | 键值2 | 数据指针/主键值 | → 。。。→ | 键值N | 数据指针/主键值 |
- 查找算法:二分查找(Binary Search)
- 时间复杂度:O(log N),比顺序扫描O(N)快1~2个数量级。
- 优化与边界处理:
- 页内目录(Page Directory):InnoDB在叶子节点内部维护了一个稀疏目录,将键值划分为多个区间,快速缩小查找范围。
- 自适应策略:当键值分布不均匀时,动态调整二分查找的步长(如指数跳跃查找)。
- 重复键处理:对于允许重复的索引(如非唯一索引),通过主键值进一步排序,确保所有记录可唯一定位。
- 物理存储格式:
处理查询结果
覆盖索引:若查询字段均在索引中,直接返回数据(避免回表)。
回表操作:二级索引需用主键值再次查询聚簇索引。