Mysql高级(周阳)笔记之查询优化(完整详细)

原创已于 2023-11-10 20:48:29 修改 · 1k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#mysql #数据库

于 2021-01-28 15:24:11 首次发布

数据库同时被 2 个专栏收录

27 篇文章

订阅专栏

mysql

8 篇文章

订阅专栏

本文介绍了MySQL查询优化的关键点，包括遵循小表驱动大表的原则，优化ORDER BY和GROUP BY操作，减少FileSort的使用，通过调整sort_buffer_size和max_length_for_sort_data参数提升效率，以及利用索引优化分页查询和去重操作。通过实例分析和优化策略，展示了如何避免全表扫描和提高查询性能。

1. 一般优化流程

在这里插入图片描述

2. 永远小表驱动大表

在这里插入图片描述

例：

在这里插入图片描述

3. Order by排序优化

ORDER BY子句，尽量使用Index方式排序,避免使用FileSort方式排序

3.1 建表SQL

CREATE TABLE tblA(
  id int primary key not null auto_increment,
  age INT,
  birth TIMESTAMP NOT NULL,
  name varchar(200)
);
 
INSERT INTO tblA(age,birth,name) VALUES(22,NOW(),'abc');
INSERT INTO tblA(age,birth,name) VALUES(23,NOW(),'bcd');
INSERT INTO tblA(age,birth,name) VALUES(24,NOW(),'def');
 
CREATE INDEX idx_A_ageBirth ON tblA(age,birth,name);
 
SELECT * FROM tblA;

3.2 分析

MySQL支持二种方式的排序，FileSort和Index，Index效率高. 它指MySQL扫描索引本身完成排序。FileSort方式效率较低。
ORDER BY满足两情况，会使用Index方式排序:
1. ORDER BY 语句使用索引最左前列
2. 使用Where子句与Order BY子句条件列组合满足索引最左前列
where子句中如果出现索引的范围查询(即explain中出现range)会导致order by 索引失效。
尽可能在索引列上完成排序操作，遵照索引建的最佳左前缀

3.3 filesort的两种算法

如果不在索引列上，filesort有两种算法： mysql就要启动双路排序和单路排序

3.3.1 双路排序

MySQL 4.1之前是使用双路排序,字面意思就是两次扫描磁盘，最终得到数据，读取行指针和orderby列，对他们进行排序，然后扫描已经排序好的列表，按照列表中的值重新从列表中读取对应的数据输出
从磁盘取排序字段，在buffer进行排序，再从磁盘取其他字段。
取一批数据，要对磁盘进行了两次扫描，众所周知，I\O是很耗时的，所以在mysql4.1之后，出现了第二种改进的算法，就是单路排序。
多路排序需要借助磁盘来进行排序。所以取数据，排好了取数据。两次 io操作。比较慢

3.3.2 单路排序

从磁盘读取查询需要的所有列，按照order by列在buffer对它们进行排序，然后扫描排序后的列表进行输出，它的效率更快一些，避免了第二次读取数据。并且把随机IO变成了顺序IO,但是它会使用更多的空间，因为它把每一行都保存在内存中了。
单路排序，将排好的数据存在内存中，省去了一次 io 操作，所以比较快，但是需要内存空间足够。

单路存在问题：

在sort_buffer中，单路比双路要多占用很多空间，因为方法B是把所有字段都取出, 所以有可能取出的数据的总大小超出了sort_buffer的容量，导致每次只能取sort_buffer容量大小的数据，进行排序（创建tmp文件，多路合并），排完再取取sort_buffer容量大小，再排……从而多次I/O。

本来想省一次I/O操作，反而导致了大量的I/O操作，反而得不偿失。

优化策略：

增大sort_buffer_size参数的设置，用于单路排序的内存大小。
增大max_length_for_sort_data参数的设置，单次排序字段大小。(单次排序请求)
去掉select 后面不需要的字段,select 后的多了，排序的时候也会带着一起，很占内存，所以去掉没有用的.

3.4 Order by 总结

Order by时select * 是一个大忌只Query需要的字段，这点非常重要。在这里的影响是：
1. 当Query的字段大小总和小于max_length_for_sort_data 而且排序字段不是 TEXT|BLOB 类型时，会用改进后的算法——单路排序，否则用老算法——多路排序。
2. 两种算法的数据都有可能超出sort_buffer的容量，超出之后，会创建tmp文件进行合并排序，导致多次I/O，但是用单路排序算法的风险会更大一些,所以要提高sort_buffer_size。
尝试提高 sort_buffer_size

不管用哪种算法，提高这个参数都会提高效率，当然，要根据系统的能力去提高，因为这个参数是针对每个进程的
尝试提高 max_length_for_sort_data

提高这个参数，会增加用改进算法的概率。但是如果设的太高，数据总容量超出sort_buffer_size的概率就增大，明显症状是高的磁盘I/O活动和低的处理器使用率.

在这里插入图片描述

4. Group by优化

跟Order By差不多
group by实质是先排序后进行分组，遵照索引建的最佳左前缀
当无法使用索引列，增大max_length_for_sort_data参数的设置+增大sort_buffer_size参数的设置
where高于having，能写在where限定的条件就不要去having限定了

5. 分页查询的优化—limit

 EXPLAIN    SELECT  SQL_NO_CACHE * FROM emp  ORDER  BY  deptno   LIMIT 10000,40

那我们就给deptno这个字段加上索引吧。

然并卵。

优化：先利用覆盖索引把要取的数据行的主键取到，然后再用这个主键列与数据表做关联：(查询的数据量小了后)

EXPLAIN  SELECT  SQL_NO_CACHE * FROM emp INNER JOIN (SELECT id FROM emp e ORDER BY deptno LIMIT 10000,40) a ON a.id=emp.id

最后比较一下查询速度：

实践证明： ①、order by 后的字段（XXX）有索引 ②、sql 中有 limit 时，

当 select id 或 XXX字段索引包含字段时，显示 using index

当 select 后的字段含有 order by 字段索引不包含的字段时，将显示 using filesort

6. 去重优化

尽量不要使用 distinct 关键字去重！！

在这里插入图片描述

例子：select kcdz form t_mall_sku where id in( 3,4,5,6,8 ) 将产生重复数据，

select distinct kcdz form t_mall_sku where id in( 3,4,5,6,8 ) 使用 distinct 关键字去重消耗性能

优化： select kcdz form t_mall_sku where id in( 3,4,5,6,8 ) group by kcdz 能够利用到索引

Mysql高级(周阳)笔记之查询优化(完整详细)

目录

1. 一般优化流程

2. 永远小表驱动大表

3. Order by排序优化

3.1 建表SQL

3.2 分析

3.3 filesort的两种算法

3.3.1 双路排序

3.3.2 单路排序

3.4 Order by 总结

4. Group by优化

5. 分页查询的优化—limit

6. 去重优化