推荐用临时表,把查询的结果放在临时表里面,再从临时表分页取数给前端。这里面会有一些问题,因为你是服务端,前端可能会有多人并发的情况。所以在分临时表的时侯,需要按用户ID来标识这个表是谁的。另外在用户退出登录的时侯,需要清空该用户所有的临时表。
需要做“相同条件”的数据缓存吗?有的技术方案会把所有的请求进行比较,条件相同的不再新建临时表。这也是一个办法,看个人喜好。
我们看看都有哪些方案来处理大数据表的查询和分页?
一、临时表优化方案
会话级临时表设计
使用数据库原生会话级临时表(如PostgreSQL的TEMPORARY TABLE)
自动隔离不同会话,无需手动添加用户ID后缀
会话结束时自动清理,避免内存泄漏
智能缓存管理
建立条件指纹机制:MD5(查询条件+排序方式)作为缓存标识
LRU缓存淘汰策略:保持最近使用的前100个查询缓存
定时清理机制:设置30分钟无访问自动销毁
二、替代临时表的优化方案
1、Keyset分页技术(游标分页)
-- 首次查询
SELECT * FROM large_table
WHERE create_time > '2023-01-01'
ORDER BY id, create_time
LIMIT 1000;
-- 后续分页
SELECT * FROM large_table
WHERE id > last_id_value
AND create_time > '2023-01-01'
ORDER BY id, create_time
LIMIT 1000;
优势:完全避免临时表,利用索引快速定位
要求:必须存在有序唯一列(如自增ID)
2、物化视图加速
CREATE MATERIALIZED VIEW report_cache_202311
AS
SELECT columns, aggregate_functions
FROM large_table
WHERE conditions
GROUP BY dimensions
WITH DATA;
-- 配合定时刷新
REFRESH MATERIALIZED VIEW CONCURRENTLY report_cache_202311;