mysql主键实现原理_mysql 非主键做范围查找实现原理的一点困惑

本文以InnoDB为例,深入解析了MySQL中不同类型的索引如何工作。包括主键索引的构建方式及其对数据分布的影响,辅助索引的查询过程,以及如何利用覆盖索引优化查询效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

以 innodb 为例。

下面很多图都截图来自于 http://blog.codinglabs.org/ar…

CREATE TABLE `test` (

`id` int(11) unsigned NOT NULL AUTO_INCREMENT,

`age` int(11) unsigned NOT NULL,

`name` varchar(30) NOT NULL DEFAULT '',

PRIMARY KEY (`id`),

KEY `idx_name` (`name`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

插入下列数据

mysql> select * from test;

+----+-----+-------+

| id | age | name  |

+----+-----+-------+

| 15 |  34 | Bob   |

| 18 |  77 | Alice |

| 20 |   5 | Jim   |

| 30 |  91 | Eric  |

| 49 |  22 | Tom   |

| 50 |  89 | Rose  |

+----+-----+-------+

6 rows in set (0.00 sec)

因为主键是单调递增的,所以这里会以主键聚集,如图

0a11f58dba4de50c6f97a2d6d9f6287b.png

这样如果我做范围查找

mysql> explain select * from test where id>16\G;

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: test

partitions: NULL

type: range

possible_keys: PRIMARY

key: PRIMARY

key_len: 4

ref: NULL

rows: 5

filtered: 100.00

Extra: Using where

1 row in set, 1 warning (0.00 sec)

查找的过程比较清晰,查询到 B+树最左端的叶子节点,然后 mysql 对 B+ 树做了优化,各个叶子节点之间多了指针串连。

因为 Innodb 的特性,数据和聚簇索引都在一起了,就是上图的截图

当使用

name

做精确查找的时候,比较清晰,根据索引找到主键,然后再通过主键再去查询。

450cf3a3b20fc4dca5e026eea427167f.png

mysql> explain select * from test where name='Bob'\G;

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: test

partitions: NULL

type: ref

possible_keys: idx_name

key: idx_name

key_len: 92

ref: const

rows: 1

filtered: 100.00

Extra: NULL

1 row in set, 1 warning (0.00 sec)

新增一个索引

ALTER TABLE `test` ADD INDEX `idx_age` (`age`);

mysql> explain select * from test FORCE INDEX(idx_age) where age>20\G;

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: test

partitions: NULL

type: range

possible_keys: idx_age

key: idx_age

key_len: 4

ref: NULL

rows: 5

filtered: 100.00

Extra: Using index condition

1 row in set, 1 warning (0.00 sec)

我的困惑,根据

idx_age

索引找到了各个叶子页的数据,但是叶子页上只是有对应主键的指针,后面根据

idx_age

所有查询的主键,再去聚簇索引中查询的过程是怎样的。假如对应的主键的数据都不在一页上,那是不是有多少行,就要多少次从聚簇索引顶端到叶子页的查询;

还是先查询出所有的主键了,先根据主键排序,然后查询到最小的主键,然后依次往后找其他主键数据,最后再按照 age 的顺序对数据排序返回?

根据个人理解以及看书是拿到主键id,然后根据id去逐条回表随机访问。一般的索引建立,都会带上主键。

比如你上面的age,其实你的索引是(

age

,

id

)。按照你的理解来说,既然都查询到了所有的主键,然后排序花费nLog(n)的复杂度,接着还是逐条回表随机访问,有啥区别?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值