MySQL 通过主键和二级索引查询数据的详细过程

原创已于 2025-06-06 15:15:40 修改 · 712 阅读

CC 4.0 BY-SA版权

文章标签：

于 2025-06-06 15:05:56 首次发布

28 篇文章

订阅专栏

在这里插入图片描述

下面我将详细解释在千万级数据表中，通过主键(id)和二级索引(name)查询单条数据的完整过程，包括B+树索引的遍历机制。

SELECT * FROM t1 WHERE id = 123456;

         [根节点]
      /      |      \
 [分支节点1] [分支节点2] [分支节点3]
  /   \       /   \       /   \
[叶子节点] [叶子节点] ... [叶子节点]  ← 存储实际数据行

访问根节点
- MySQL 加载主键索引的根节点（常驻内存）
- 根节点包含主键范围区间和指向分支节点的指针
- 示例根节点内容：
```
[min_id=1, max_id=5000000] → 分支节点A地址
[min_id=5000001, max_id=10000000] → 分支节点B地址
```
定位分支节点
- 对 id=123456 进行二分查找
- 确定属于 [1, 5000000] 区间
- 根据指针加载分支节点A到内存

定位叶子节点

分支节点A内容示例：

[1-1000000] → 叶子节点X地址
[1000001-2000000] → 叶子节点Y地址
[2000001-5000000] → 叶子节点Z地址

在叶子节点定位数据
- 叶子节点存储完整数据行（聚集索引特性）
- 节点内有序存储所有主键和数据：
```
1000001: [行数据1]
1000002: [行数据2]
...
123456: [目标行数据] ← 找到！
...
2000000: [行数据n]
```
- 通过二分查找直接定位到 id=123456 对应的数据行
返回结果
- 直接返回叶子节点中的完整数据行
- 总磁盘I/O：2-3次（分支节点常驻内存时只需1次叶子节点加载）

SELECT * FROM t1 WHERE name = 'John';

         [根节点]
      /      |      \
 [分支节点] [分支节点] [分支节点]
  /   \       /   \       /   \
[叶子节点] [叶子节点] ... [叶子节点]  ← 存储主键值

访问二级索引根节点
- 加载 name 索引的根节点
- 根节点包含name的字母范围：
```
[A-M] → 分支节点A地址
[N-Z] → 分支节点B地址
```
定位分支节点
- 'John' 首字母 J 属于 [A-M] 范围
- 加载分支节点A到内存
定位叶子节点
- 分支节点A内容示例：
```
[A-D] → 叶子节点X地址
[E-J] → 叶子节点Y地址
[K-M] → 叶子节点Z地址
```
- 'John' 属于 [E-J] 范围
- 加载叶子节点Y到内存
在叶子节点获取主键
- 二级索引叶子节点存储：
```
name值 + 主键id
```
- 示例内容：
```
'James': 1001
'Jane': 1002
'John': 123456 ← 找到目标name对应的主键!
'Julia': 1004
```
- 通过二分查找到 name='John'，获取其主键 id=123456
回表查询（关键步骤）
- 使用主键值 123456 回到主键索引
- 重复主键查询的所有步骤：
  1. 主键索引根节点 → 分支节点 → 叶子节点
  2. 在主键索引叶子节点中获取完整数据行
返回结果
- 返回最终查询到的数据行
- 总磁盘I/O：4-6次（二级索引2-3次 + 主键索引2-3次）

覆盖索引优化

-- 只查询索引包含的列，避免回表
SELECT id, name FROM t1 WHERE name = 'John';

索引设计优化

-- 创建联合索引减少回表
ALTER TABLE t1 ADD INDEX idx_name_email(name, email);

热数据缓存
- InnoDB Buffer Pool缓存热点索引和数据页
- 配置足够内存：innodb_buffer_pool_size = 系统内存的70-80%

统计信息更新

ANALYZE TABLE t1; -- 更新索引统计信息

💡 性能实测：在SSD存储的MySQL 8.0环境中，千万数据表的主键查询可在 0.1ms 内完成，二级索引查询在 0.5ms 内完成（Buffer Pool命中情况下）。

通过合理利用B+树索引的特性，即使面对海量数据，MySQL仍能保持高效的查询性能。理解索引工作原理有助于设计更优化的数据库结构和查询语句。