innodb buffer pool

文章详细描述了InnoDB数据库的缓冲池如何使用LRU算法管理和优化内存,包括页链表结构、新旧子列表策略、预读策略以及针对空闲页和脏页的内存管理方法。特别提到innodb_old_blocks_time参数对减少预读问题的影响。

buffer pool是主存中的一个区域,InnoDB 在访问时缓存表和索引数据。缓冲池允许直接从内存访问频繁使用的数据,这加快了处理速度。在专用服务器上,高达80% 的物理内存通常分配给缓冲池。为了提高大容量读取操作的效率,将缓冲池划分为可能包含多行的页。为了提高缓存管理的效率,缓冲池被实现为页链表; 使用最近使用次数最少(LRU)算法的一个变体,很少使用的数据被老化到缓存之外。

buffer pool LRU

innodb buffer pool LRU在一个新页加入的时候会将最近最少使用的页驱逐出去,并将新页加入到链表中间。中点插入策略将链表看作两个子链表

  • 在new sublist的head是最近访问过的
  • 在old sublist的tail是最近最少访问过的

在这里插入图片描述

在该算法中定义最频繁访问的页在new sublist,old sublist则是访问不频繁的页,等待被淘汰

  1. 最初访问的页(用户发起的操作或者预读)将会插入到两个sublist的中点。也即new sublist尾部,old sublist头部

  2. 访问old sublist的页将会使之移动到new sublist的head

    如果由于用户发起的操作需要读取该页,则立即进行第一次访问,并使该页更新。如果由于预读操作而读取了该页,则第一次访问不会立即发生,并且可能在驱逐该页之前根本不会发生。

  3. 当数据库运行时,缓冲池中未被访问的页面会向列表尾部移动,从而“老化”。new sublist中的页面都会随着其他页面的更新而老化。old sublist中的页面也会随着页面在中点插入而老化。最终,未使用的页面到达old sublist的尾部并被驱逐。

默认情况下,查询读取的页面会立即移动到新的子列表中,这意味着它们在缓冲池中停留的时间更长。例如,对于mysqldump操作或不带WHERE子句的SELECT语句执行的表扫描,可能会将大量数据带入缓冲池,并驱逐等量的旧数据,即使新数据不再使用。类似地,由预读后台线程加载且只访问一次的页面被移动到新列表的头部。这些情况可以将经常使用的页面推到旧的子列表中,在那里它们将被删除。

为应对这种情况,innodb在进入new sublist增加了在old sublist的停留时间innodb_old_blocks_time(默认1000ms),也就是在这个时间间隔内,就不会从old移动到new区

预读

在上面的LRU中提到了预读,那么在innodb中预读是如何表现的呢?

  • linear: 当一个区有连续56页(56是默认值,可以通过设置innodb_read_ahead_threshold改变。范围是0-64,因为最大就是64页)都被读取,那么该区所有页将会被异步预读到buffer pool
  • random: 当一个区随机13个页(13是innodb_random_read_ahead的默认值)都在buffer pool中,那么该区所有页将会被异步预读到buffer pool

innodb LRU在原来LRU的基础上重点是尽快驱逐那些较少使用的数据,为此引入了分段式的链表以及从old到new的时间限制

其实这两个手段很大程度上都是在解决预读所引发的问题,前者是由于预读机制的存在,可能会导致大量并没有实际访问过的数据驱逐了少量实际访问的数据;后者则是因为全表扫描之类情况扫描了全表数据,又因为预读的存在,多读了一次会使得被扫描的数据直接到new sublist

这算得是是一种应对这两种情况的好手段,我在想相比于改良版的k-lru究竟孰强孰弱呢?毕竟只要k设置的合理,这两种情况其实都能避免,只是说k-lru多引入了对访问次数的维护

buffer pool内存管理

在buffer pool中内存管理主要是针对空闲页(也就是如何很快地分配空闲页)以及脏页(也就是如何很快地刷新到持久化储存)

对此,采用了free链表、flush链表分别设计用来管理空闲页和脏页,那样就能很快锁定需要的页,而不需要全部扫描

Ref

  1. https://dev.mysql.com/doc/refman/8.0/en/innodb-buffer-pool.html
  2. https://dev.mysql.com/doc/refman/8.0/en/innodb-performance-read_ahead.html
  3. https://dev.mysql.com/doc/refman/8.0/en/innodb-parameters.html#sysvar_innodb_old_blocks_time
  4. https://xiaolincoding.com/mysql/buffer_pool/buffer_pool.html
<think>我们正在讨论MySQL InnoDB Buffer Pool的淘汰机制。根据引用[2]和引用[3],我们知道Buffer Pool使用了一种基于LRU(最近最少使用)算法的淘汰机制,但进行了优化,以避免全表扫描等操作导致的热数据被淘汰的问题。具体来说,InnoDB将LRU链表分为两个部分:新生代(new sublist)和老生代(old sublist)。默认情况下,新生代占5/8,老生代占3/8。 当新页面读入Buffer Pool时,它首先被插入到老生代的头部(即整个LRU链表的5/8位置,也就是老生代的头部)。这样,全表扫描等操作一次性加载的大量数据会首先进入老生代,而不会直接进入新生代,从而避免它们立即淘汰新生代中的热点数据。 当页面被访问时,如果该页面已经在老生代中,并且在其被加载后存活了一段时间(通过参数`innodb_old_blocks_time`设置,默认1000毫秒),那么再次访问该页面时,它会被移动到新生代的头部。如果在设定的时间内被再次访问,则不会移动,因为可能只是临时访问(如全表扫描)。 淘汰过程发生在当Buffer Pool需要空间来加载新页面时。InnoDB会从LRU链表的尾部(即老生代的尾部)开始淘汰页面。如果老生代的页面被修改过(成为脏页),则需要先将其刷新到磁盘(由后台线程完成)才能被淘汰。 此外,Buffer Pool还通过其他链表管理,如free链表(记录空闲缓存页)、flush链表(记录脏页)等,但淘汰机制主要基于改进的LRU链表。 现在,我们根据这些信息来回答用户的问题。</think>### MySQL InnoDB Buffer Pool 淘汰机制工作原理 MySQL InnoDB Buffer Pool 的淘汰机制采用**改进型LRU算法**(Least Recently Used,最近最少使用),通过多层链表结构和冷热数据分离策略优化传统LRU算法,避免全表扫描等操作污染热数据。具体工作原理如下: #### 一、核心数据结构 1. **LRU链表**(核心淘汰控制) - 分为两个子链表: - **新生代(New Sublist)**:存放热点数据,占5/8空间 - **老生代(Old Sublist)**:存放新加载或低频数据,占3/8空间 - 链表头部为最近访问数据,尾部为待淘汰数据 2. **Free链表** - 管理空闲缓存页,当需要加载新页时从此链表获取空间 3. **Flush链表** - 记录被修改过的脏页(需刷盘) #### 二、淘汰流程 1. **新数据插入** - 新页首次加载时插入老生代头部(非LRU头部) ```mermaid graph LR A[磁盘数据页] --> B{Buffer Pool空间} B -->|有空闲页| C[从Free链表取页] B -->|无空闲页| D[触发淘汰] D --> E[淘汰老生代尾部页] E --> F[新页插入老生代头部] ``` 2. **数据访问规则** - 访问老生代数据时: - 若数据在内存中停留时间 < `innodb_old_blocks_time`(默认1000ms),保持原位 - 若停留时间 ≥ 该阈值,则移至新生代头部 - 访问新生代数据时直接移至新生代头部 3. **淘汰触发条件** - 当Free链表无空闲页时 - 淘汰顺序: 1. 从老生代尾部选取未修改的干净页直接淘汰 2. 若老生代无干净页,则淘汰新生代尾部页 3. 若需淘汰脏页,需先加入Flush链表由后台线程刷盘 #### 三、关键优化设计 1. **冷热隔离** - 全表扫描加载的数据仅存在老生代,避免冲击热数据 - 通过`innodb_old_blocks_pct`调整老生代比例(默认37%) 2. **时间窗口保护** - `innodb_old_blocks_time`参数建立时间屏障,防止短期访问污染新生代 3. **批量淘汰** - 每次淘汰触发时清理多个页面(避免频繁淘汰影响性能) #### 四、参数配置示例 ```sql -- 查看关键参数 SHOW VARIABLES LIKE 'innodb_old_blocks_pct'; -- 老生代占比 SHOW VARIABLES LIKE 'innodb_old_blocks_time'; -- 冷数据保护时间(ms) ``` > **设计意义**:此机制有效平衡了高频访问数据的留存与突发数据加载的影响,在TPCC测试中可使查询性能提升10倍以上[^2][^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值