MySQL 的 Buffer Pool

原创于 2025-06-13 17:53:37 发布 · 582 阅读

29 ·

CC 4.0 BY-SA版权

文章标签：

#mysql #数据库

Mysql 专栏收录该内容

13 篇文章

订阅专栏

Buffer Pool（缓冲池） 是 InnoDB 存储引擎的核心组件之一，对数据库性能起着决定性作用。它本质上是一块在 MySQL 进程启动时分配的、用于缓存表和索引数据的连续内存区域。

核心目标

减少磁盘 I/O： 这是最主要的目标。访问内存（RAM）的速度比访问磁盘（即使是 SSD）快几个数量级。Buffer Pool 将频繁访问的“热数据”保留在内存中，使得后续对相同数据的读请求可以直接从内存获取，极大提升响应速度。
加速写操作： 对数据的修改（INSERT, UPDATE, DELETE）并不是每次都直接写入磁盘，而是先修改 Buffer Pool 中的缓存页（称为“脏页”）。后续再由专门的机制（Checkpoint）在合适的时间点将脏页批量、高效地刷新到磁盘文件（.ibd）中。这种延迟写入的策略大大提高了写操作的吞吐量。
提高并发性： 内存中的并发访问控制（如行锁、MVCC 所需的 Undo 日志访问）比直接在磁盘文件上进行要高效得多。

核心组件

缓存页（Page）：
- Buffer Pool 被划分为固定大小的单元（默认 16KB），称为“页”（Page）。
- 每个缓存页对应磁盘上一个同样大小的 InnoDB 表空间文件（.ibd）中的数据页。
- 缓存页不仅包含表数据，也包含索引数据。
控制块（Control Blocks）：
- 每个缓存页都有一个对应的控制块（约 5% 的额外内存开销）。
- 控制块存储管理缓存页所需的元数据：
  - 页所属的表空间 ID 和页号（用于唯一标识磁盘页）。
  - 指向页数据的指针。
  - 页的状态（是否空闲、是否脏、是否被锁定等）。
  - 用于 LRU 链表和 Flush 链表的指针。
  - 访问计数、修改 LSN（Log Sequence Number）等信息。
链表结构（用于管理缓存页）：
- Free List： 链表头指向所有空闲的、未被使用的缓存页。当需要将新数据页加载到 Buffer Pool 时，优先从这里获取空闲页。
- LRU List（Least Recently Used）：
  - 传统 LRU 问题： 简单的 LRU 算法容易受到全表扫描（一次加载大量只读一次的数据）的影响，导致真正的“热数据”被挤出。
  - InnoDB 优化： LRU List 被分为两个子链表：
    - New Sublist： 存储最近被频繁访问的热数据页。头部是最新访问的页。
    - Old Sublist： 存储新加载进来的数据页。尾部是即将被淘汰的候选页。
  - 流程：
    1. 新数据页首次加载到 Buffer Pool 时，被插入到 Old Sublist 的头部。
    2. 当 Old Sublist 中的页再次被访问时，它会被移动到 New Sublist 的头部。
    3. 当 New Sublist 中的页被访问时，它会被移动到 New Sublist 的头部。
    4. 随着新页的不断加入，Old Sublist 尾部的页会被淘汰（如果它是干净的，直接覆盖；如果是脏的，需要先刷新到磁盘）。
    5. New Sublist 尾部的页也可能被降级到 Old Sublist 的头部（作为 Old Sublist 的新成员），然后 Old Sublist 尾部的页被淘汰。这确保了真正热的数据有更长的生命周期。
  - innodb_old_blocks_pct： 控制 Old Sublist 占整个 LRU List 的比例（默认 37%）。
  - innodb_old_blocks_time： 设置一个时间窗口（毫秒）。在 Old Sublist 中的页，即使在这个时间窗口内被再次访问，也不会立即提升到 New Sublist。这是专门防御全表扫描等操作的关键参数（默认 1000ms）。对于大表扫描，可以临时增大此值。
- Flush List (Dirty Page List)： 链表头指向所有被修改过但尚未写回磁盘的脏页（Dirty Page）。脏页按照其第一次被修改时的 LSN（Log Sequence Number）排序。后台的刷脏线程（Page Cleaner Thread）根据策略（如 Checkpoint）从这个链表中选择脏页刷新到磁盘。这个链表不决定淘汰顺序，只管理刷脏。

流程

读取数据：
1. 当 InnoDB 需要读取一个数据页时（例如通过索引查找），它首先检查该页是否已在 Buffer Pool 中（通过表空间 ID + 页号查找）。
2. 命中： 如果页在 Buffer Pool 中：
  - 直接返回内存中的数据。
  - 如果该页在 LRU List 的 Old Sublist 中，并且距离上次访问已超过 innodb_old_blocks_time，则将其移动到 New Sublist 头部（使其成为更“热”的页）。
  - 如果该页在 New Sublist 中，则将其移动到 New Sublist 头部。
3. 未命中： 如果页不在 Buffer Pool 中：
  - 从 Free List 获取一个空闲页。如果没有空闲页，则触发 LRU 淘汰机制：从 LRU List 尾部（通常是 Old Sublist 尾部）淘汰一个页。
  - 如果淘汰的页是脏页，则必须先将其刷新到磁盘（同步 I/O 操作，会导致延迟！），然后才能释放该页空间。
  - 将磁盘上的目标数据页加载到刚刚获得的空闲缓存页中。
  - 将该新加载的页插入到 LRU List 的 Old Sublist 头部。
  - 返回内存中的数据。
修改数据 (DML)：
1. 在 Buffer Pool 中找到需要修改的数据页（如果不在，先加载）。
2. 修改 Buffer Pool 中的页数据（此时页变为“脏页”）。
3. 将修改操作记录写入 Redo Log Buffer（内存中），后续由 Log Thread 刷新到磁盘的 Redo Log 文件（ib_logfileX）。这是保证持久性的关键。
4. 如果该脏页之前不在 Flush List 中，则将其加入到 Flush List（按修改 LSN 排序）。

刷脏机制

脏页不能无限期驻留在内存中，必须最终写回磁盘以保证持久性（即使崩溃，也能通过 Redo Log 恢复）。
由后台的 Page Cleaner Threads (innodb_page_cleaners, 通常设置为等于或略小于 innodb_buffer_pool_instances) 负责。
刷脏触发点：
- 检查点 (Checkpoint)：
  - Sharp Checkpoint： 数据库关闭时将所有脏页刷新（除非设置了 innodb_fast_shutdown=2）。
  - Fuzzy Checkpoint： 运行时进行的部分脏页刷新，避免关闭时一次性刷太多。包括：
    - LRU Flush： 当 Free List 不足，需要淘汰脏页时触发。
    - Flush List Flush： 根据脏页比例 (innodb_max_dirty_pages_pct, innodb_max_dirty_pages_pct_lwm)、Redo Log 空间利用率、保证恢复时间 (innodb_io_capacity_max 影响峰值刷脏速率) 等策略触发，从 Flush List 尾部（最老的修改）开始刷。
    - Async/Sync Flush： 当 Redo Log 空间即将耗尽（超过一定阈值如 75%, 90%）时，强制进行更激进的刷脏以推进 Checkpoint LSN，回收可重用的 Redo Log 空间。
- 空闲时： 系统相对空闲时也会进行一些刷脏。
innodb_io_capacity / innodb_io_capacity_max： 这些参数告诉 InnoDB 磁盘 I/O 的大致能力（IOPS），用于动态调整后台刷脏的速率。设置过低会导致刷脏跟不上修改速度，脏页堆积；设置过高可能浪费 I/O 资源。对于现代 SSD，建议设置较高值（如几百到几千）。

配置参数

innodb_buffer_pool_size： 最重要！ 设置 Buffer Pool 的总大小。通常建议设置为可用物理内存的 50%-80%（需要给 OS、其他 MySQL 组件、连接线程等留内存）。
innodb_buffer_pool_instances： 将 Buffer Pool 划分为多个独立的区域（实例）。每个实例有自己的锁和链表，减少并发访问冲突，提高扩展性（尤其在多核 CPU 上）。建议设置为 4-8 或更高（但每个实例至少 1GB）。
innodb_old_blocks_pct： 控制 LRU List 中 Old Sublist 的比例（默认 37%）。
innodb_old_blocks_time： 控制 Old Sublist 中的页在再次访问后，需要等待多久才能提升到 New Sublist（默认 1000ms）。防御全表扫描。
innodb_max_dirty_pages_pct： 允许脏页占 Buffer Pool 的最大百分比（默认 90%）。InnoDB 会尽量控制脏页比例在此值之下。
innodb_max_dirty_pages_pct_lwm： 脏页比例的低水位线（默认 0%）。当脏页比例超过此值时，InnoDB 会开始更积极地刷脏，以防止其飙升到 innodb_max_dirty_pages_pct。
innodb_io_capacity： 定义常规 I/O 吞吐能力（IOPS），用于控制后台刷脏的平均速率（默认 200，SSD 建议调高）。
innodb_io_capacity_max： 定义 I/O 吞吐能力的上限（IOPS），用于紧急刷脏（如 Redo Log 快满时，默认 2000，SSD 建议调高）。
innodb_flush_neighbors： 刷脏时是否刷新相邻的脏页（默认 1, 开启）。对于 SSD（寻道时间几乎为0），建议关闭（设置为0）以提升刷脏效率。
innodb_buffer_pool_load_at_startup / innodb_buffer_pool_dump_at_shutdown / innodb_buffer_pool_dump_pct： 控制关闭时转储 Buffer Pool 的热页信息（页号列表），启动时自动预热加载这些热页，加速达到最佳性能状态。建议开启（默认开启）。

监控

SHOW ENGINE INNODB STATUS\G： 查看 BUFFER POOL AND MEMORY 部分。关键指标：
- Buffer pool size：总页数。
- Free buffers：Free List 中的页数。
- Database pages：LRU List 中的页数（包含脏页和干净页）。
- Old database pages：Old Sublist 中的页数。
- Modified db pages：当前脏页数（大致等于 Flush List 长度）。
- Pages made young/not young：从 Old 提升到 New 的次数 / 在 Old 中被访问但未提升的次数（受 innodb_old_blocks_time 影响）。
- Buffer pool hit rate：最近一段时间的缓存命中率（百分比）。理想情况应接近 100%（如 95%-99%+）。低于 90% 通常意味着 innodb_buffer_pool_size 可能不足或存在大量非必要扫描。
- I/O sum：最近读取/创建的页数（累计值）。
Performance Schema： 表如 performance_schema.events_waits_summary_global_by_event_name 可查看等待事件（如等待空闲页 wait/synch/mutex/innodb/buf_pool_mutex），performance_schema.file_summary_by_instance 查看文件 I/O。
SHOW GLOBAL STATUS： 关注：
- Innodb_buffer_pool_read_requests：逻辑读取请求数（总访问量）。
- Innodb_buffer_pool_reads：无法从 Buffer Pool 满足，必须从磁盘读取的页数。
- 缓存命中率计算： (1 - Innodb_buffer_pool_reads / Innodb_buffer_pool_read_requests) * 100%
- Innodb_buffer_pool_wait_free：需要等待空闲页的次数（如果经常发生，说明 Buffer Pool 可能太小或刷脏跟不上）。
- Innodb_buffer_pool_pages_dirty：当前脏页数。
- Innodb_pages_written：已写回的页数（累计）。