各数据库分页机制之比较

原创于 2025-12-04 15:45:44 发布 · 416 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#数据库 #分页

Database 专栏收录该内容

3 篇文章

订阅专栏

各数据库分页机制之比较

概述

数据库分页是处理大量数据时的关键技术，不同的数据库系统提供了多种分页实现方式。本文将深入比较主流数据库的分页机制，分析其性能特点、适用场景以及优缺点。

主要分页方法

1. LIMIT/OFFSET 分页（传统分页）

MySQL 实现

-- 基本语法
SELECT * FROM users 
ORDER BY id 
LIMIT 10 OFFSET 20;

-- 简写形式
SELECT * FROM users 
ORDER BY id 
LIMIT 20, 10;

PostgreSQL 实现

SELECT * FROM users 
ORDER BY created_at 
LIMIT 10 OFFSET 20;

SQL Server 实现

-- 使用 OFFSET-FETCH
SELECT * FROM users 
ORDER BY id 
OFFSET 20 ROWS FETCH NEXT 10 ROWS ONLY;

-- 传统 TOP 方式（SQL Server 2012 之前）
SELECT TOP 10 * FROM (
    SELECT TOP 30 * FROM users ORDER BY id
) AS temp 
ORDER BY id DESC;

Oracle 实现

-- 使用 ROWNUM（Oracle 12c 之前）
SELECT * FROM (
    SELECT a.*, ROWNUM rnum FROM (
        SELECT * FROM users ORDER BY id
    ) a WHERE ROWNUM <= 30
) WHERE rnum > 20;

-- 使用 OFFSET-FETCH（Oracle 12c+）
SELECT * FROM users 
ORDER BY id 
OFFSET 20 ROWS FETCH NEXT 10 ROWS ONLY;

性能特点

优点：实现简单，易于理解和使用
缺点：大数据量下性能下降明显，OFFSET 越大查询越慢
原因：数据库仍需扫描并跳过 OFFSET 指定的行数

2. 游标分页（Cursor-based Pagination）

基本原理

使用上一页最后一条记录的唯一标识作为游标，查询后续数据。

MySQL 实现

-- 第一次查询
SELECT * FROM users 
ORDER BY id 
LIMIT 10;

-- 后续查询（假设最后一条记录的 id 是 100）
SELECT * FROM users 
WHERE id > 100 
ORDER BY id 
LIMIT 10;

PostgreSQL 实现

-- 使用复合排序条件
SELECT * FROM posts 
WHERE (created_at, id) > ('2023-01-01 10:00:00', 12345) 
ORDER BY created_at DESC, id DESC 
LIMIT 10;

MongoDB 实现

// 第一次查询
db.users.find().sort({_id: 1}).limit(10)

// 后续查询（使用最后一条记录的 _id）
db.users.find({_id: {$gt: ObjectId("...")}})
    .sort({_id: 1}).limit(10)

性能特点

优点：性能稳定，不受页码影响
缺点：不支持随机跳页，只能顺序翻页
适用：社交媒体时间线、消息列表等

3. 键集分页（Keyset Pagination）

基本原理

类似于游标分页，但支持更复杂的排序条件。

多字段排序示例（PostgreSQL）

-- 按多个字段排序的分页
SELECT * FROM products 
WHERE (category, price, id) > ('Electronics', 999.99, 12345) 
ORDER BY category ASC, price DESC, id ASC 
LIMIT 10;

时间范围分页

-- 按时间戳分页，处理相同时间戳的情况
SELECT * FROM events 
WHERE (event_time, id) > ('2023-01-01 12:00:00', 12345) 
ORDER BY event_time DESC, id DESC 
LIMIT 10;

性能对比分析

查询性能测试

分页方法	小数据量 (1万条)	中数据量 (100万条)	大数据量 (1亿条)	随机跳页支持
LIMIT/OFFSET	优秀	良好	差	支持
游标分页	优秀	优秀	优秀	不支持
键集分页	优秀	优秀	优秀	不支持

内存使用对比

-- MySQL EXPLAIN 分析 LIMIT/OFFSET
EXPLAIN SELECT * FROM large_table 
ORDER BY id 
LIMIT 10 OFFSET 999990;

-- 结果：需要扫描 100万行，内存消耗大

-- MySQL EXPLAIN 分析游标分页
EXPLAIN SELECT * FROM large_table 
WHERE id > 999990 
ORDER BY id 
LIMIT 10;

-- 结果：只扫描 10行，内存效率高

各数据库特色功能

MySQL

覆盖索引优化：确保 ORDER BY 字段有索引
延迟关联：先查询主键，再关联获取完整数据

-- 延迟关联示例
SELECT u.* FROM users u
INNER JOIN (
    SELECT id FROM users 
    ORDER BY created_at 
    LIMIT 10 OFFSET 20
) AS tmp ON u.id = tmp.id;

PostgreSQL

索引优化：支持多种索引类型（B-tree、Hash、GiST、GIN）
并行查询：大数据量分页可启用并行处理

-- 使用索引优化
CREATE INDEX CONCURRENTLY idx_users_created_at_id 
ON users(created_at DESC, id DESC);

-- 并行查询提示
SET max_parallel_workers_per_gather = 4;

Oracle

ROWNUM 优化：使用嵌套查询优化性能
分区表支持：大数据表分区提升分页性能

-- 分区表分页
SELECT * FROM (
    SELECT /*+ FIRST_ROWS(10) */ 
        p.*, ROW_NUMBER() OVER (ORDER BY created_at) AS rn
    FROM partitioned_users p
    WHERE created_at >= DATE '2023-01-01'
)
WHERE rn BETWEEN 21 AND 30;

SQL Server

查询提示：使用查询提示优化执行计划
列存储索引：分析查询场景下的性能提升

-- 使用查询提示
SELECT * FROM users 
ORDER BY created_at 
OFFSET 20 ROWS FETCH NEXT 10 ROWS ONLY
OPTION (OPTIMIZE FOR (@rows = 10));

MongoDB

索引交集：支持多个索引的交集操作
覆盖索引查询：直接从索引返回结果

// 创建复合索引
db.users.createIndex({created_at: -1, _id: 1})

// 覆盖索引查询
db.users.find(
    {created_at: {$gt: new Date('2023-01-01')}},
    {_id: 1, created_at: 1, name: 1}
).sort({created_at: -1}).limit(10)

最佳实践建议

1. 选择合适的分页方法

使用 LIMIT/OFFSET 的场景：

数据量较小（< 10万条）
需要支持随机跳页
管理后台、报表系统

使用游标/键集分页的场景：

数据量大（> 10万条）
社交媒体、消息流
移动端列表展示

2. 索引优化策略

-- 为分页查询创建合适的索引
-- MySQL/PostgreSQL
CREATE INDEX idx_pagination ON users(status, created_at DESC, id DESC);

-- 覆盖索引示例
CREATE INDEX idx_covering ON orders(user_id, status, created_at DESC, id DESC);

3. 查询优化技巧

避免 SELECT *

-- 不推荐
SELECT * FROM users LIMIT 10 OFFSET 20;

-- 推荐
SELECT id, name, email FROM users LIMIT 10 OFFSET 20;

使用延迟关联

-- 大字段表的分页优化
SELECT u.id, u.name, u.email 
FROM users u
WHERE u.id IN (
    SELECT id FROM users 
    ORDER BY created_at DESC 
    LIMIT 10 OFFSET 20
);

4. 应用层优化

缓存策略

# Redis 缓存分页结果
def get_user_page(page, size):
    cache_key = f"users:page:{page}:size:{size}"
    cached_data = redis.get(cache_key)
    
    if cached_data:
        return json.loads(cached_data)
    
    # 查询数据库
    users = db.query(User).limit(size).offset((page-1)*size).all()
    
    # 缓存结果
    redis.setex(cache_key, 300, json.dumps(users))
    return users

预加载策略

// 前端预加载下一页
class PaginationManager {
    constructor() {
        this.cache = new Map();
        this.currentPage = 1;
    }
    
    async loadPage(page) {
        // 检查缓存
        if (this.cache.has(page)) {
            return this.cache.get(page);
        }
        
        // 加载数据
        const data = await fetch(`/api/users?page=${page}`);
        this.cache.set(page, data);
        
        // 预加载下一页
        if (!this.cache.has(page + 1)) {
            this.preloadPage(page + 1);
        }
        
        return data;
    }
    
    async preloadPage(page) {
        const data = await fetch(`/api/users?page=${page}`);
        this.cache.set(page, data);
    }
}

性能监控与调优

监控指标

-- MySQL 慢查询监控
SHOW VARIABLES LIKE 'slow_query_log%';
SHOW STATUS LIKE 'Slow_queries';

-- PostgreSQL 查询统计
SELECT query, calls, total_time, mean_time 
FROM pg_stat_statements 
WHERE query LIKE '%LIMIT%' 
ORDER BY mean_time DESC;

性能分析工具

# MySQL EXPLAIN 分析
EXPLAIN FORMAT=JSON SELECT * FROM users LIMIT 10 OFFSET 100000;

# PostgreSQL EXPLAIN ANALYZE
EXPLAIN (ANALYZE, BUFFERS) SELECT * FROM users LIMIT 10 OFFSET 100000;