MySQL联合索引的命中规则

本文深入探讨MySQL中联合索引的使用原则,包括最左原则的应用,以及OR操作符如何影响索引效率。通过具体示例,解析不同查询条件下索引的命中情况,为数据库查询优化提供实践指导。

一.建表

创建测试表foo,创建联合索引,顺序abc

CREATE TABLE foo (
a VARCHAR ( 20 ) DEFAULT '' NULL,
b VARCHAR ( 20 ) DEFAULT '' NULL,
c VARCHAR ( 20 ) DEFAULT '' NULL,
d VARCHAR ( 20 ) DEFAULT '' NULL 
);
CREATE INDEX foo_index_a_b_c ON foo ( a, b, c );

Mysql的联合索引,根据最左原则, 有a,ab,abc三个最左索引前缀可供命中;

即:只要查询条件中带有a字段条件,或者同时带有ab两个字段的条件,或者同时带有abc三个字段的条件,都会使用到联合索引abc

二.前七种情况

下面给出八种情况示例,前三种能用到索引,4 5 6没有用到,第7种只有索引最左边的字段能用到

第一条的执行结果

-- 1 组成abc索引前缀,完整使用了abc联合索引
explain select * from foo where d='kk' and a='uu' and b='xx' and c='mm'

第二三条的执行结果

-- 2 组成ab索引前缀,使用了abc联合索引的ab部分
explain select * from foo where a='uu' and b='xx' and d='kk'

-- 3 组成a索引前缀,使用了abc联合索引的 a部分
explain select * from foo where a='uu' and d='kk'

 

第四条执行结果

-- 4 无法组成最左索引前缀
explain select * from foo where b='xx' and d='kk' and c='mm'

 第五六条执行结果

-- 5 全or情况
explain select * from foo where a='uu' or  b='xx' or  c='mm'

-- 6 部分or情况
explain select * from foo where a='uu' and b='xx' or  c='mm'

注意:where后面的搜索条件顺序是没有影响的,mysql的查询优化器会自动优化查询;

第七条执行结果

-- 7 范围查询-只有索引最左边的列进行范围查找才能用到索引,因为只有a相同时才能用到b的排序;
-- 所以,除非a是精确查询,b是范围查询,此时就可以用到ab部分的索引
explain select * from foo where a>'uu' and a<'xx' and b>'kk'

 

InnoDB的索引虽然采用的B+tree结构,大原则上也遵循最左匹配;但是真正执行查询的时候,会根据实际情况,不一定会走索引,比如使用order by(字段符合索引顺序,不符合再多数据也不走)数据太少时,不会走索引。

三.关于or导致索引失效?

而第8种情况,是针对or是否会使索引失效;

此时我们对foo表增加一条索引

ALTER TABLE foo ADD KEY index_c ('c')

此时表结构

CREATE TABLE `foo` (
  `a` varchar(20) DEFAULT '',
  `b` varchar(20) DEFAULT '',
  `c` varchar(20) DEFAULT '',
  `d` varchar(20) DEFAULT '',
  KEY `foo_index_a_b_c` (`a`,`b`,`c`),
  KEY `index_c` (`c`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

执行第6条语句

explain select * from foo where a='uu' and b='xx' or  c='mm'

此时可以看到是用到了索引的; 

我们在以上前提下,再执行第5条语句

explain select * from foo where a='uu' or b='xx' or  c='mm'

可以发现没有用到索引;

总结:将or左右条件拆开时,这两部分只要其中之一独立使用用不到索引,那么这整条or语句就不会进索引; 

<think>嗯,用户问的是MySQL查询语句命中索引是否就一定快。这个问题看起来简单,但其实需要仔细分析。首先,我得回想一下索引的基本原理,以及在实际应用中可能遇到的各种情况。 索引的作用主要是加快数据检索速度,通过减少全表扫描的需要。通常来说,命中索引确实能提高查询效率,但用户的问题是在所有情况下都成立吗?显然不是,所以需要找出例外情况。 首先想到的是索引的类型。比如,覆盖索引可以直接从索引中获取数据,不需要回表,这样效率很高。但如果查询需要回表,特别是当需要回表的行数很多时,可能会导致性能下降。比如,当查询返回大量数据时,使用索引可能反而更慢,因为每次回表都是一次磁盘I/O操作,累积起来反而比全表扫描更耗时。 然后,索引的选择性也是一个关键因素。如果索引列的值重复率很高,比如性别字段,这样的索引选择性低,即使命中索引,数据库可能仍然需要扫描大量的行,效率提升有限。这时候优化器可能会选择全表扫描而不是使用索引。 还有索引碎片的问题。如果表中的数据经常增删改,导致索引碎片化,这时候即使命中索引,查询效率也会降低,因为物理存储不连续,增加了磁盘I/O的次数。 另外,联合索引的字段顺序也会影响效率。如果查询条件没有按照最左前缀原则使用联合索引,可能导致索引失效或者只能部分使用,这样效果可能不如预期。 还有数据量的问题。当数据量非常小时,全表扫描可能更快,因为使用索引需要额外的查找开销。优化器在这种情况下可能会选择不使用索引。 此外,查询的复杂性也是一个因素。如果查询涉及到多个条件,其中某些条件命中索引,但其他条件需要额外的过滤,这时候整体效率可能仍然不高。 比如,用户可能有一个包含age和name的联合索引,但查询中使用了age范围查询,而name是等值查询。这种情况下,索引的使用可能不如预期高效,因为范围查询会导致后续的索引列无法有效利用。 还有,隐式类型转换或者函数操作可能导致索引失效,比如在WHERE子句中对索引列使用函数,这会让MySQL无法使用索引,从而降低效率。不过用户的问题是关于命中索引的情况,所以这种情况可能不算在内,但需要确认是否属于命中索引的范围。 再想,如果索引列的数据分布不均匀,比如某些值特别集中,这时候即使使用索引,也可能需要扫描大量数据页,效率不高。比如,某个状态字段有90%的值都是“完成”,这时候查询状态为“完成”的记录,即使有索引,可能也不如全表扫描快。 此外,多表连接时,即使每个表都使用了索引,但如果连接顺序不当或者连接条件复杂,也可能导致性能问题。比如,嵌套循环连接中,驱动表的选择不当,可能导致大量磁盘I/O。 还有,索引的维护成本。虽然查询时命中索引可能快,但写操作(INSERT、UPDATE、DELETE)时需要维护索引,可能会影响整体性能,但这属于另一个层面的问题,用户的问题可能更关注查询时的性能。 总结下来,需要从索引类型、数据量、索引选择性、索引碎片、查询条件、数据分布、优化器选择等多个方面来分析。然后把这些点组织成用户容易理解的回答,用例子说明每种情况,帮助用户理解为什么有时候即使命中索引,查询也不一定快。</think>MySQL查询命中索引不一定保证查询速度快,需结合以下场景综合分析: 1. **覆盖索引与非覆盖索引** - ✅ 覆盖索引场景:`SELECT id FROM users WHERE age=25`(age有索引索引直接存储id和age,无需回表,速度极快 - ❌ 非覆盖索引场景:`SELECT * FROM users WHERE age=25`(age有索引) 需根据索引查主键后回表查完整数据,当命中10万行时产生10万次磁盘IO 2. **索引选择性** - 高选择性场景:`SELECT * FROM orders WHERE order_id='123'`(唯一索引) 精准定位1条记录,效率极高 - 低选择性场景:`SELECT * FROM users WHERE gender='F'`(gender有索引) 当表中80%都是女性时,索引扫描可能比全表扫描更慢 3. **数据分布特征** - 极端案例:`SELECT * FROM logs WHERE status=1`(status有索引) 当status=1占99%数据时,优化器可能选择全表扫描 4. **索引碎片影响** 某表经历大量DELETE操作后,索引碎片率达40%: ```sql ALTER TABLE orders FORCE INDEX(idx_created_at); SELECT * FROM orders WHERE created_at > '2024-01-01'; ``` 实际查询时间反而比全表扫描慢2倍 5. **联合索引使用** 存在联合索引`(province,city,district)`: - 高效场景:`WHERE province='浙江' AND city='杭州'` - 低效场景:`WHERE city='杭州'`(无法使用最左前缀) 6. **优化器误判** 当表统计信息过期时: ```sql ANALYZE TABLE users; -- 更新统计信息前 SELECT * FROM users WHERE age BETWEEN 20 AND 25; ``` 实际有50万数据符合,但统计信息显示预估1万行,导致错误选择索引 7. **范围查询陷阱** ```sql SELECT * FROM products WHERE price > 100 ORDER BY create_time DESC LIMIT 20; ``` 存在`(price)`索引但无`(price,create_time)`联合索引时,需排序操作可能更慢 **优化建议:** 1. 定期执行`ANALYZE TABLE`更新统计信息 2. 对范围查询+排序场景建立复合索引 3. 使用`FORCE INDEX`前先通过`EXPLAIN`验证 4. 对低选择性字段谨慎建立索引 5. 定期执行`OPTIMIZE TABLE`整理索引碎片 实际案例:某电商订单表`(order_status)`索引查询反而变慢,最终解决方案是: ```sql ALTER TABLE orders ADD INDEX idx_status_created(status,created_at), DROP INDEX idx_status; ``` 通过组合查询字段和排序字段建立联合索引,使查询耗时从1.2s降至0.02s。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值