MySQL组合索引和最左匹配原则

最新推荐文章于 2025-07-08 15:27:02 发布

转载最新推荐文章于 2025-07-08 15:27:02 发布 · 4k 阅读

9 ·

CC 4.0 BY-SA版权

原文链接：https://juejin.im/post/5c862b3ff265da2dda698456

文章标签：

#数据库

什么时候创建组合索引?

当我们的where查询存在多个条件查询的时候，我们需要对查询的列创建组合索引

为什么不对没一列创建索引

减少开销
覆盖索引
效率高

减少开销：假如对col1、col2、col3创建组合索引，相当于创建了（col1）、（col1，col2）、（col1，col2，col3）3个索引

覆盖索引：假如查询SELECT col1, col2, col3 FROM 表名，由于查询的字段存在索引页中，那么可以从索引中直接获取，而不需要回表查询

效率高：对col1、col2、col3三列分别创建索引，MySQL只会选择辨识度高的一列作为索引。假设有100w的数据，一个索引筛选出10%的数据，那么可以筛选出10w的数据；对于组合索引而言，可以筛选出100w*10%*10%*10%=1000条数据

最左匹配原则

假设我们创建（col1，col2，col3）这样的一个组合索引，那么相当于对col1列进行排序，也就是我们创建组合索引，以最左边的为准，只要查询条件中带有最左边的列，那么查询就会使用到索引

创建测试表

CREATE TABLE `student` (
  `id` int(11) NOT NULL,
  `name` varchar(10) NOT NULL,
  `age` int(11) NOT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_id_name_age` (`id`,`name`,`age`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
复制代码

填充100w测试数据

DROP PROCEDURE pro10;
CREATE PROCEDURE pro10()
BEGIN
	DECLARE i INT;
	DECLARE char_str varchar(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789';
	DECLARE return_str varchar(255) DEFAULT '';
	DECLARE age INT;
	SET i = 1;
	WHILE i < 5000000 do
		SET return_str = substring(char_str, FLOOR(1 + RAND()*62), 8);
		SET i = i+1;
		SET age = FLOOR(RAND() * 100);
		INSERT INTO student(id, name, age) values(i, return_str, age);
	END WHILE;
END;

CALL pro10();
复制代码

场景测试

EXPLAIN SELECT * FROM student WHERE id = 2;
复制代码

可以看到该查询使用到了索引

EXPLAIN SELECT * FROM student WHERE id = 2 AND name = 'defghijk';
复制代码

可以看到该查询使用到了索引

EXPLAIN SELECT * FROM student WHERE id = 2 AND name = 'defghijk' and age = 8;
复制代码

可以看到该查询使用到了索引

EXPLAIN SELECT * FROM student WHERE id = 2 AND age = 8;
复制代码

可以看到该查询使用到了索引

EXPLAIN SELECT * FROM student WHERE name = 'defghijk' AND age = 8;
复制代码

可以看到该查询没有使用到索引，类型为index，查询行数为4989449，几乎进行了全表扫描，由于组合索引只针对最左边的列进行了排序，对于name、age只能进行全部扫描

EXPLAIN SELECT * FROM student WHERE name = 'defghijk' AND id = 2;

EXPLAIN SELECT * FROM student WHERE age = 8 AND id = 2;

EXPLAIN SELECT * FROM student WHERE  name = 'defghijk' and age = 8 AND id = 2;
复制代码

可以看到如上查询也使用到了索引，id放前面和放后面查询到的结果是一样的，MySQL会找出执行效率最高的一种查询方式，就是先根据id进行查询