mysql order by limit 1 和max的比较

在一次数据的需求中,去用order by+limit 1和 max两种方式求数据的最大值时,发现在同一过滤条件下order by limit 1执行时间要比max快。然后从一下两个角度对问题进行来思考。

1.查看执行计划:

a.max查询计划

b.order by+limit 1查询计划

其中Extra是指执行情况的描述和说明。max的extra对应的值是 Select tables optimized away

order by + limit 的extra选项对应的值是 Using index

extra项解释:

Select tables optimized away:

使用某些聚合函数(比如 max、min)来访问存在索引的某个字段

来自于mysql官网对Select tables optimized away的描述:

For explains on simple count queries (i.e. explain select count(*) from 
people) the extra section will read "Select tables optimized away.
" This is due to the fact that MySQL can read the result directly from
 the table internals and  therefore does not need to perform the select.

Using index:直接在主键索引上完成查询和所有数据的获取。

2.order by和where的执行顺序是否是先做的order by,后使用where过滤。

结论:因为max和order by+limit 1都是使用的主键值进行查询,而主键在mysql中是b+树。在叶子节点主键id本身就是按从小大的顺序排列的。所以在查询中会出现以下两种情况:

a.如果是查询普通列(非主键且该值没有索引列)条件,max()的查询速度要优于order by+limit 1,原因是从explain的执行计划中可以看出:order by+limit 1使用了索引,而使用max根本没有遍历表或索引就返回数据了
b.如果是主键值的查询可以分两种情况来讨论:

1.)如果是max()和order by速度的比较,max()的速度要比order by快,order by会把所有查询到的结果并展示出来。

select max(id) from  table_name:



select id  from  table_name  order by id desc;

2.)如果是max()和order by+limit 1 速度的比较,order by+limit 1会在查到第一条数据时返回结果。而不是对整个结果进行排序。如果使用索引来完成排序,这将非常快。如果你将LIMIT row_count子句与ORDER BY子句组合在一起使用的话,一旦找到第一个row_count之后,MySQL不会对结果集的任何剩余部分进行排序。这种行为的一种表现形式是,一个ORDER BY查询带或者不带LIMIT可能返回行的顺序是不一样的。

参考资料:

我们都是小青蛙MySQL系列文章

mysql官方文档

MySQL中,`ORDER BY`与`LIMIT`结合使用时可能引发性能问题,特别是在大数据量的表中。以下是一些优化方法: 1. **避免不必要的排序**:如果查询结果集已经满足排序要求,则可以避免额外的排序操作。例如,如果数据天然按照某个字段递增或递减排列,那么可以省略`ORDER BY`。 2. **合理使用索引**:为`ORDER BY`字段创建合适的索引有助于提升查询速度。对于包含多个字段的复合索引,确保排序字段位于索引中的正确位置。例如,如果经常需要按`id`降序排序,可以考虑为`id`字段单独建立一个索引或者将它放在复合索引的最后[^1]。 3. **减少排序的数据量**:通过添加更多的过滤条件来减少参与排序的数据量。这可以通过更精确的`WHERE`子句实现,从而减少排序限制操作所需的资源消耗[^3]。 4. **调整系统变量**:增大`max_length_for_sort_data`系统变量值可以帮助MySQL选择更高效的排序算法,前提是你的服务器有足够的内存来处理增加的数据量。 5. **分页优化**:当涉及到大量的分页时(如`LIMIT 1000, 10`),可以尝试使用延迟关联(Deferred Join)策略。首先从覆盖索引获取主键ID,然后再进行一次查询以获取完整的行数据。这种方法减少了需要扫描排序的数据量[^5]。 6. **分析执行计划**:利用`EXPLAIN`命令查看SQL语句的执行计划,了解是否有效地使用了索引以及是否有全表扫描的情况发生,并据此作出相应的优化措施。 7. **考虑缓存机制**:对于频繁执行且数据变化不大的查询,可以采用查询缓存或其他形式的应用层缓存来降低数据库的压力。 8. **定期维护表**:保持统计数据是最新的,这样优化器才能做出最佳的选择。定期运行`ANALYZE TABLE`命令更新统计信息。 9. **重构查询逻辑**:有时改变查询逻辑本身也能带来显著的性能改进。比如,如果你只需要最新的几条记录,而这些记录总是插入到表的末尾,那么或许可以直接基于`id`的最大值来进行筛选。 示例代码展示了一个简单的`EXPLAIN`用法,用于分析查询: ```sql EXPLAIN SELECT * FROM your_table WHERE f1 = 1 AND w5 = 'xx' AND w6 = 'zz' ORDER BY id DESC LIMIT 10; ``` 此外,还可以尝试对上述查询进行重写,以利用索引来加速访问: ```sql SELECT * FROM ( SELECT id FROM your_table WHERE f1 = 1 AND w5 = 'xx' AND w6 = 'zz' ORDER BY id DESC LIMIT 10 ) AS ids JOIN your_table ON your_table.id = ids.id; ``` 此方法先找出符合过滤条件并按`id`排序后的前10个`id`值,然后仅针对这些`id`执行最终的查找,通常比直接在整个数据集上做排序要快得多。 需要注意的是,在应用任何优化之前都应该先收集基准性能指标,并在实施后再次测量,以便确认所做的更改确实带来了预期的效果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值