【复习408】Cache的替换策略

原创已于 2025-10-25 15:17:47 修改 · 649 阅读

CC 4.0 BY-SA版权

文章标签：

于 2025-10-19 00:03:06 首次发布

16 篇文章

订阅专栏

Cache替换策略的设计基于程序局部性原理，尤其是时间局部性（最近被访问的数据很可能在不远的将来再次被访问）。因此，策略的核心思路是：优先保留那些最有可能被再次访问的数据块。

以下是几种经典且常见的Cache替换策略。
1. 随机替换

2. 先进先出

原理：将Cache视为一个队列，替换最早进入Cache的那个块。
优点：
- 实现简单，易于理解和实现。
缺点：
- 同样无视访问局部性。一个最早调入但当前正在被频繁访问的块（如循环程序代码）可能会被替换掉，导致命中率下降。
- 可能会出现Belady异常，即分配的物理页面数增加时，缺页率反而升高的现象。

3. 最近最少使用

原理：替换最长时间没有被访问过的缓存块。它基于“如果数据最近被访问过，那么将来很可能还会被访问”的假设。
优点：
- 能很好地反映程序的时间局部性，在大多数情况下能提供较高的命中率，是效果很好的常用算法。
缺点：
- 硬件实现复杂，成本高。要精确追踪所有块的使用时间顺序，需要为每个缓存块维护计数器或使用复杂的硬件结构（如寄存器栈或矩阵），当Cache较大时开销显著。
- 它主要关注“最近”的使用情况，可能无法反映整个历史访问模式或频率偏好。

4. 最不经常使用

原理：替换访问次数最少的缓存块。它为每个缓存块维护一个计数器，每次被访问时计数器加1，替换时选择计数值最小的块。
优点：
- 基于访问频率，在某些特定访问模式下可能有效。
缺点：
- 实现代价高，需要大量的计数器和比较逻辑。
- 缺乏时间维度。一个在早期被频繁访问但之后不再使用的块，会因为其高计数值而长期滞留，占据空间，而新调入的、可能即将被频繁访问的块却可能因计数低被很快替换掉（缓存污染问题）。

1. 伪LRU

原理：PLRU是LRU的一种低成本近似。它不再严格维护精确的访问顺序，而是使用更少的比特位来近似地找到“相对最近较少使用”的块。例如，对于一个8路组相联Cache，真LRU需要7个状态位，而PLRU可能只需要7个比特但采用树形结构管理，大幅降低了复杂度。
特点：以微小的命中率损失换取硬件成本的大幅降低，是现代硬件Cache中非常常见的实现方式。

2. 其他高级策略

自适应替换缓存（ARC）‍ ：一种智能策略，它动态地平衡对新近访问数据和频繁访问数据的缓存，具有良好的自适应性。
Belady最优算法（也称为OPT）：这是一种理论上的最优算法，它会在替换时选择在未来最长时间内不会被访问的块。此算法需要预知未来的访问序列，因此无法在实际系统中实现，通常仅作为衡量其他算法性能的理论基准。

下表总结了上述主要策略的特点：