有个同事小同志突然发了两段SQL过来,说:哥,我有段SQL查询有问题帮我看看啥情况。
缩减后的SQL如下:
# 1
SELECT
id,
standard,
first_id,
update_time
FROM
cy_do_base
WHERE
STATUS = '1'
AND ( is_pass = 3 AND has_num > '0' )
ORDER BY
update_time DESC
LIMIT 10;
# 2
SELECT
id,
standard,
first_id,
update_time
FROM
cy_do_base
WHERE
STATUS = '1'
AND ( is_pass = 3 AND has_num > '0' )
ORDER BY
update_time DESC
LIMIT 10, 10
执行结果如下:
可以看到id=60这条数据出现了两次。
原因分析
首先我们要知道MySQL对无索引的字段Limit分页查询是逻辑分页,每次查询都会重新排序和过滤数据,并且 对于相同的值,它们的排序是不确定的(MySQL无法保证相同排序字段值的记录顺序稳定性)。
示例:若 ID=60 和 ID=55 的 update_time
相同,第一次查询时 ID=60 可能排在第10位,第二次查询时可能排在第11位,导致它同时出现在两页中。
解决方案
几种解决方案:
1. 确保排序唯一性
-
在 order by中增加唯一字段(如id,当然,得确保id字段具有唯一性(如主键或唯一索引),否则仍可能出现排序不稳定)作为第二排序条件,保证结果稳定性:
ORDER BY update_time DESC, id DESC
-
这样即使 update_time 相同,记录也会按 id 进一步排序,避免顺序随机变动。
2. 使用基于游标的分页(推荐)
-
记录上一页最后一条记录的 update_time 和 id ,下页查询时基于这些值过滤:
假设 上一页最后一条记录的 update_time 为 '2023-10-01 12:00:00',id 为 60
WHERE
...
AND
(update_time < '2023-10-01 12:00:00' OR (update_time = '2023-10-01 12:00:00' AND id < 60))
ORDER BY update_time DESC, id DESC
LIMIT 10
-
优势:避免
OFFSET
性能问题,且结果稳定。
3. 创建索引
B+树是有序的,因此如果你针对where 和 order by的字段做了索引,那么B+树是会保证数据稳定的。
效果:
查看一下执行计划:
到这里就差不多能解释和解决重复查询的问题了。希望对大家有帮助。
以上只是一个思路,企业级项目中 最好的还是联合索引搭配上游标翻页使用。这样不会有深翻页和查询问题,还能保证性能。有兴趣的小伙伴可以自己去搜搜了解学习一下。