深度分页所存在的问题
我们一般做深度分页的时候, sql语句往往如下:
SELECT * FROM tb_test ORDER BY id DESC LIMIT 10000, 20;
LIMIT 10000 , 20的意思扫描满足条件的10020行,扔掉前面的10000行,返回最后的20行。如果是LIMIT 1000000 , 100,需要扫描1000100 行,在一个高并发的应用里,每次查询需要扫描超过100W行,不慢就没天理了。
如何解决问题
一般的解决思路是增加一些搜索条件, 比如将上一次查询的最大id作为下一次查询的一个参数,这样可以大幅减少数据的扫描
SELECT * FROM tb_test where `year` = 2017 and id > XXXX ORDER BY id desc limit 20;
这里有个限制条件,就是我们只能实现页码顺序滚动
如果不得不做深度分页,还有一个代码技巧:
# 反例(耗时129.570s)
select * from tb_test LIMIT 20000000, 10;
# 正例(耗时5.114s)
SELECT a.* FROM tb_test a, (select id from tb_test LIMIT 20000000, 10) b where a.id = b.id;