SQL进阶——优化思路

优化注意事项:

尽量避免使用select *

        在实际业务场景中,真正需要使用的只有其中一两列。写SQL语句时,有时候为了方便,直接使用select *,一次性查出表中所有列的数据。多查出来的数据,在网络传输的过程中,会增加数据传输的时间。更重要的是,select 不会走覆盖索引,会出现大量的回表操作,从而导致查询性能很低。

小表驱动大表

        即用小表的数据集驱动大表的数据集。假如有order和user两张表,其中order表有10000条数据,而user表有100条数据。这时如果想查一下所有有效的用户下过的订单列表,可以使用in关键字实现:select * from order where user_id in (select id from user where status=1)。sql语句中包含了in关键字,则它会优先执行in里面的子查询语句,再执行in外面的语句。如果in里面的数据量很少,作为条件查询速度更快。
        但缺点是MySQL执行子查询时,需要创建临时表,查询完毕后,需要再删除这些临时表,有一些额外的性能消耗。这时可以改成连接查询:select o. from order o inner join user u on o.user_id=u.id where u.status=1。

避免in中值太多

        如果in中的值太多,会导致查询效率下降。尽量避免这种情况,或者通过其他方式优化。
有时候使用连接查询比子查询更高效。

控制join表的数量

        如果join太多,MySQL在选择索引的时候会非常复杂,很容易选错索引。并且如果没有命中索引,如果实现业务场景中需要查询出另外几张表中的数据,可以在a、b、c表中冗余专门的字段,比如:在表a中冗余d_name字段,保存需要查询出的数据。

控制索引的数量

        索引能够显著的提升查询性能,但索引数量并非越多越好。表新增数据时,需要同时为它创建索引,而索引是需要额外的存储空间的,而且还会有一定的性能消耗。MySQL使用的B+树的结构来保存索引的,在insert、update和delete操作时,需要更新B+树索引。如果索引过多,会消耗很多额外的性能。

提升group by的效率

        很多业务场景需要使用group by关键字,它主要功能是去重和分组。通常它会跟having一起配合使用,表示分组后再根据一定的条件过滤数据。

        反例:select user_id,user_name from order group by user_id having user_id<=200。这种写法性能不好,它先把所有的订单根据用户id分组之后,再去过滤用户id大于等于200的用户。

        正例:select user_id,user_name from order where user_id<=200 group by user_id。使用where条件在分组前,就把多余的数据过滤掉了,这样分组时效率就会更高一些。

        其实这是一种思路,不仅限于group by的优化。我们的SQL语句在做一些耗时的操作之前,应尽可能缩小数据范围,这样能提升SQL整体的性能。

索引优化

        SQL优化当中,有一个非常重要的内容就是:索引优化。很多时候SQL语句走了索引和没走索引执行效率差别很大。索引优化的第一步是:检查SQL语句有没有走索引。可以使用explain命令,查看MySQL的执行计划。进而查看索引是否生效。SQL语句没有走索引排除没有建索引之外最大的可能性就是索引失效。

EXPLAIN是什么?

EXPLAIN 是 MySQL 中的一个诊断命令,用于获取查询执行计划的信息。通过使用 EXPLAIN,你可以了解 MySQL 是如何执行 SQL 查询的,包括它是如何选择表、连接顺序、使用的索引等。这对于优化查询性能非常有帮助。

这条命令将不会真正执行查询,而是返回一个描述MySQL如何执行该查询的报告。

只能解释select查询,并不会对存储过程调用和insert,update,delete或其他语句做解释

字段含义优化建议
id查询标识符,标识查询中的每个SELECT语句。-
select_type查询类型,如简单查询、子查询等。根据查询类型优化查询结构,减少不必要的子查询。
table当前行描述的表名或别名。-
partitions查询涉及的分区信息。如果使用了分区表,确保查询能够有效利用分区。
type访问类型,影响查询速度,从好到差:system > const > eq_ref > ref > range > index > ALL尽量提高访问类型,避免使用ALL类型的全表扫描。
possible_keysMySQL可以使用但最终可能未选择的索引列表。如果possible_keys为空,考虑添加索引。
key实际使用的索引名称。确保查询使用了正确的索引,提高查询效率。
key_len使用的索引长度。较短的key_len通常更好,但也要考虑索引的选择性。
ref查找索引列上值所使用的列或常量。-
rows预计需要读取的行数。减少rows数量,通过优化索引或查询条件。
filtered符合查询条件的行的比例。提高filtered比例,优化查询条件,使更多的行在早期被过滤掉。
Extra额外信息,如使用临时表、文件排序等。避免Using temporaryUsing filesort,优化查询或索引设计。

 写业务逻辑较为复杂的SQL,经常会碰到多表查询、表数据量大查不动的情况。通常会在数据量大的表建立索引,方便后续能更快的查询。但是可能效果还是不尽人意,这就要优化SQL了。

优化步骤

 如果SQL没有按照预定的执行速度执行,可以用EXPLAIN命令诊断这条语句是怎么执行的。

优化示例:

待优化示例:

WITH filtered_sd AS (
    SELECT sd.* FROM vap_video_status_day sd
    LEFT JOIN bas_road_segment_info rs ON sd.road_segment_id = rs.road_segment_id
    LEFT JOIN bas_road_info ri ON rs.road_id = ri.road_id
    LEFT JOIN bas_device_info B ON B.device_id = sd.camera_id
    WHERE DATE_FORMAT( sd.stat_time, '%Y-%m-%d' ) ='2025-01-05'
    ORDER BY sd.stat_time DESC
)
SELECT fsd.*, ri.road_full_name, B.stake_id, B.special_5 AS special5,
B.device_code as deviceCode,B.special_14 as positionType,
GROUP_CONCAT(detail.status ORDER BY detail.recording_time) AS status_list
FROM filtered_sd fsd
LEFT JOIN bas_road_segment_info rs ON fsd.road_segment_id = rs.road_segment_id
LEFT JOIN bas_road_info ri ON rs.road_id = ri.road_id
LEFT JOIN bas_device_info B ON B.device_id = fsd.camera_id
LEFT JOIN
    (
        SELECT device_id, status, recording_time
        FROM vap_video_status_detail
        WHERE DATE_FORMAT(recording_time, '%Y-%m-%d') = '2025-01-05'
        AND device_id IN (SELECT camera_id FROM filtered_sd)
    ) detail ON detail.device_id = fsd.camera_id
GROUP BY fsd.id
ORDER BY fsd.stat_time DESC

优化示例:

WITH filtered_sd AS (
  SELECT
    device_id,
    GROUP_CONCAT(`status` ORDER BY recording_time SEPARATOR ',') AS status_concat 
  FROM
    vap_video_status_detail    
  WHERE
    recording_time >= '2025-01-05 00:00:00' 
    AND recording_time < '2025-01-06 00:00:00' 
  GROUP BY
    device_id
)
  
SELECT
  sd.*,
  ri.road_full_name,
  B.stake_id,
  B.special_5 AS special5,
  B.device_code AS deviceCode,
  B.special_14 AS positionType,
  detail.status_concat 
FROM
  vap_video_status_day sd
  LEFT JOIN bas_road_segment_info rs ON sd.road_segment_id = rs.road_segment_id
  LEFT JOIN bas_road_info ri ON rs.road_id = ri.road_id
  LEFT JOIN bas_device_info B ON B.device_id = sd.camera_id
  LEFT JOIN filtered_sd detail ON detail.device_id = sd.camera_id 
WHERE
  sd.stat_time >= '2025-01-05 00:00:00' 
  AND sd.stat_time < '2025-01-06 00:00:00' 
ORDER BY
  sd.stat_time DESC;

优化思路

  1. 避免函数操作:移除 DATE_FORMAT 等列值转换函数,改为直接比较时间范围,确保索引可用。
  2. 减少子查询嵌套:将子查询改写为 CTE(Common Table Expression),提前过滤和聚合数据。
  3. 优化 JOIN 顺序:通过预聚合减少 JOIN 操作的数据量。
  4. 利用索引:确保时间字段和连接字段的索引被正确使用。
  5. 消除不必要的分组:调整 GROUP BY 逻辑,减少计算开销。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值