MySQL分页查询出现重复数据

有个同事小同志突然发了两段SQL过来,说:哥,我有段SQL查询有问题帮我看看啥情况。

缩减后的SQL如下:

# 1
SELECT
        id,
        standard,
        first_id,
				update_time
FROM
        cy_do_base 
WHERE
        STATUS = '1' 
        AND ( is_pass = 3 AND has_num > '0' ) 
ORDER BY
        update_time DESC 
        LIMIT 10;

# 2
SELECT
        id,
        standard,
        first_id,
				update_time
FROM
        cy_do_base 
WHERE
        STATUS = '1' 
        AND ( is_pass = 3 AND has_num > '0' ) 
ORDER BY
        update_time DESC 
        LIMIT 10, 10

执行结果如下:

可以看到id=60这条数据出现了两次。

原因分析

首先我们要知道MySQL对无索引的字段Limit分页查询是逻辑分页,每次查询都会重新排序和过滤数据,并且 对于相同的值,它们的排序是不确定的(MySQL无法保证相同排序字段值的记录顺序稳定性)。

示例:若 ID=60 和 ID=55 的 update_time 相同,第一次查询时 ID=60 可能排在第10位,第二次查询时可能排在第11位,导致它同时出现在两页中。

解决方案

几种解决方案:

1. 确保排序唯一性
  • 在 order by中增加唯一字段(如id,当然,得确保id字段具有唯一性(如主键或唯一索引),否则仍可能出现排序不稳定)作为第二排序条件,保证结果稳定性:

    ORDER BY update_time DESC, id DESC

  • 这样即使 update_time 相同,记录也会按 id 进一步排序,避免顺序随机变动。

2. 使用基于游标的分页(推荐)
  • 记录上一页最后一条记录的 update_time 和 id ,下页查询时基于这些值过滤:

    假设 上一页最后一条记录的 update_time 为 '2023-10-01 12:00:00',id 为 60

WHERE 
... 
AND 
(update_time < '2023-10-01 12:00:00' OR (update_time = '2023-10-01 12:00:00' AND id < 60)) 
ORDER BY update_time DESC, id DESC 
LIMIT 10
  • 优势:避免 OFFSET 性能问题,且结果稳定。

3. 创建索引

B+树是有序的,因此如果你针对where 和 order by的字段做了索引,那么B+树是会保证数据稳定的。

效果:

查看一下执行计划:

到这里就差不多能解释和解决重复查询的问题了。希望对大家有帮助。

以上只是一个思路,企业级项目中 最好的还是联合索引搭配上游标翻页使用。这样不会有深翻页和查询问题,还能保证性能。有兴趣的小伙伴可以自己去搜搜了解学习一下。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值