SQL进阶——优化思路

原创已于 2025-01-24 16:54:19 修改 · 1.1k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#sql #数据库

于 2025-01-24 16:53:46 首次发布

优化注意事项：

尽量避免使用select *

在实际业务场景中，真正需要使用的只有其中一两列。写SQL语句时，有时候为了方便，直接使用select *，一次性查出表中所有列的数据。多查出来的数据，在网络传输的过程中，会增加数据传输的时间。更重要的是，select 不会走覆盖索引，会出现大量的回表操作，从而导致查询性能很低。

小表驱动大表

即用小表的数据集驱动大表的数据集。假如有order和user两张表，其中order表有10000条数据，而user表有100条数据。这时如果想查一下所有有效的用户下过的订单列表，可以使用in关键字实现：select * from order where user_id in (select id from user where status=1)。sql语句中包含了in关键字，则它会优先执行in里面的子查询语句，再执行in外面的语句。如果in里面的数据量很少，作为条件查询速度更快。
但缺点是MySQL执行子查询时，需要创建临时表，查询完毕后，需要再删除这些临时表，有一些额外的性能消耗。这时可以改成连接查询：select o. from order o inner join user u on o.user_id=u.id where u.status=1。

避免in中值太多

如果in中的值太多，会导致查询效率下降。尽量避免这种情况，或者通过其他方式优化。
有时候使用连接查询比子查询更高效。

控制join表的数量

如果join太多，MySQL在选择索引的时候会非常复杂，很容易选错索引。并且如果没有命中索引，如果实现业务场景中需要查询出另外几张表中的数据，可以在a、b、c表中冗余专门的字段，比如：在表a中冗余d_name字段，保存需要查询出的数据。

控制索引的数量

索引能够显著的提升查询性能，但索引数量并非越多越好。表新增数据时，需要同时为它创建索引，而索引是需要额外的存储空间的，而且还会有一定的性能消耗。MySQL使用的B+树的结构来保存索引的，在insert、update和delete操作时，需要更新B+树索引。如果索引过多，会消耗很多额外的性能。

提升group by的效率

很多业务场景需要使用group by关键字，它主要功能是去重和分组。通常它会跟having一起配合使用，表示分组后再根据一定的条件过滤数据。

反例：select user_id,user_name from order group by user_id having user_id<=200。这种写法性能不好，它先把所有的订单根据用户id分组之后，再去过滤用户id大于等于200的用户。

正例：select user_id,user_name from order where user_id<=200 group by user_id。使用where条件在分组前，就把多余的数据过滤掉了，这样分组时效率就会更高一些。

其实这是一种思路，不仅限于group by的优化。我们的SQL语句在做一些耗时的操作之前，应尽可能缩小数据范围，这样能提升SQL整体的性能。

索引优化

SQL优化当中，有一个非常重要的内容就是：索引优化。很多时候SQL语句走了索引和没走索引执行效率差别很大。索引优化的第一步是：检查SQL语句有没有走索引。可以使用explain命令，查看MySQL的执行计划。进而查看索引是否生效。SQL语句没有走索引排除没有建索引之外最大的可能性就是索引失效。

EXPLAIN是什么？

EXPLAIN 是 MySQL 中的一个诊断命令，用于获取查询执行计划的信息。通过使用 EXPLAIN，你可以了解 MySQL 是如何执行 SQL 查询的，包括它是如何选择表、连接顺序、使用的索引等。这对于优化查询性能非常有帮助。

这条命令将不会真正执行查询，而是返回一个描述MySQL如何执行该查询的报告。

只能解释select查询，并不会对存储过程调用和insert，update，delete或其他语句做解释

字段	含义	优化建议
id	查询标识符，标识查询中的每个SELECT语句。	-
select_type	查询类型，如简单查询、子查询等。	根据查询类型优化查询结构，减少不必要的子查询。
table	当前行描述的表名或别名。	-
partitions	查询涉及的分区信息。	如果使用了分区表，确保查询能够有效利用分区。
type	访问类型，影响查询速度，从好到差：`system` > `const` > `eq_ref` > `ref` > `range` > `index` > `ALL`。	尽量提高访问类型，避免使用`ALL`类型的全表扫描。
possible_keys	MySQL可以使用但最终可能未选择的索引列表。	如果`possible_keys`为空，考虑添加索引。
key	实际使用的索引名称。	确保查询使用了正确的索引，提高查询效率。
key_len	使用的索引长度。	较短的`key_len`通常更好，但也要考虑索引的选择性。
ref	查找索引列上值所使用的列或常量。	-
rows	预计需要读取的行数。	减少`rows`数量，通过优化索引或查询条件。
filtered	符合查询条件的行的比例。	提高`filtered`比例，优化查询条件，使更多的行在早期被过滤掉。
Extra	额外信息，如使用临时表、文件排序等。	避免`Using temporary`和`Using filesort`，优化查询或索引设计。

写业务逻辑较为复杂的SQL，经常会碰到多表查询、表数据量大查不动的情况。通常会在数据量大的表建立索引，方便后续能更快的查询。但是可能效果还是不尽人意，这就要优化SQL了。

优化步骤

如果SQL没有按照预定的执行速度执行，可以用EXPLAIN命令诊断这条语句是怎么执行的。

优化示例：

待优化示例：

WITH filtered_sd AS (
    SELECT sd.* FROM vap_video_status_day sd
    LEFT JOIN bas_road_segment_info rs ON sd.road_segment_id = rs.road_segment_id
    LEFT JOIN bas_road_info ri ON rs.road_id = ri.road_id
    LEFT JOIN bas_device_info B ON B.device_id = sd.camera_id
    WHERE DATE_FORMAT( sd.stat_time, '%Y-%m-%d' ) ='2025-01-05'
    ORDER BY sd.stat_time DESC
)
SELECT fsd.*, ri.road_full_name, B.stake_id, B.special_5 AS special5,
B.device_code as deviceCode,B.special_14 as positionType,
GROUP_CONCAT(detail.status ORDER BY detail.recording_time) AS status_list
FROM filtered_sd fsd
LEFT JOIN bas_road_segment_info rs ON fsd.road_segment_id = rs.road_segment_id
LEFT JOIN bas_road_info ri ON rs.road_id = ri.road_id
LEFT JOIN bas_device_info B ON B.device_id = fsd.camera_id
LEFT JOIN
    (
        SELECT device_id, status, recording_time
        FROM vap_video_status_detail
        WHERE DATE_FORMAT(recording_time, '%Y-%m-%d') = '2025-01-05'
        AND device_id IN (SELECT camera_id FROM filtered_sd)
    ) detail ON detail.device_id = fsd.camera_id
GROUP BY fsd.id
ORDER BY fsd.stat_time DESC

优化示例：

WITH filtered_sd AS (
  SELECT
    device_id,
    GROUP_CONCAT(`status` ORDER BY recording_time SEPARATOR ',') AS status_concat 
  FROM
    vap_video_status_detail    
  WHERE
    recording_time >= '2025-01-05 00:00:00' 
    AND recording_time < '2025-01-06 00:00:00' 
  GROUP BY
    device_id
)
  
SELECT
  sd.*,
  ri.road_full_name,
  B.stake_id,
  B.special_5 AS special5,
  B.device_code AS deviceCode,
  B.special_14 AS positionType,
  detail.status_concat 
FROM
  vap_video_status_day sd
  LEFT JOIN bas_road_segment_info rs ON sd.road_segment_id = rs.road_segment_id
  LEFT JOIN bas_road_info ri ON rs.road_id = ri.road_id
  LEFT JOIN bas_device_info B ON B.device_id = sd.camera_id
  LEFT JOIN filtered_sd detail ON detail.device_id = sd.camera_id 
WHERE
  sd.stat_time >= '2025-01-05 00:00:00' 
  AND sd.stat_time < '2025-01-06 00:00:00' 
ORDER BY
  sd.stat_time DESC;