DDR阅读理解-FGR Mode

细粒度刷新模式(FGR)的原理与优势

原创已于 2025-02-04 21:58:24 修改 · 1.6k 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#硬件架构 #arm开发 #硬件工程

于 2025-02-02 22:48:02 首次发布

DDR 专栏收录该内容

2 篇文章

订阅专栏

从协议出发, 理解DDR的工作原理

文章目录

前言
一、FGR的工作方式
二、切换流程(FGR->非FGR)
三、FGR原理

前言

FGR模式(Fine Granularity Refresh，细粒度刷新)是一种通过更灵活的刷新管理来优化性能和数据完整性的机制。

一、FGR的工作方式

FGR模式通过将刷新操作拆分为更小的单元，每次刷新操作仅覆盖部分行(Partial Array)，减少单次刷新的时间(例如tRFC2=260ns, tRFC1=600ns)，从而降低对内存带宽的占用。
普通模式(1x)的刷新周期为tRFC1，而FGR模式(2x)可能使用更短的tRFC2，通过分多次完成全阵列刷新。
同时tREFI也会变为非FGR模式下的一半，即tREFI2=他REFI/2。这意味着在FGR模式下，会以两倍的刷新频率发出REF命令。

这里需要明确一下2x mode的定义，
1X模式：普通刷新模式下，刷新间隔为tREFI1（如7.8μs），每次刷新覆盖整个Bank的所有子阵列，耗时tRFC1（如350ns）。
2X模式（FGR）：刷新间隔缩短为tREFI2 = tREFI1/2（如3.9μs），但每次刷新仅覆盖部分子阵列，单次刷新时间缩短为tRFC2（如90ns）。
即2x mode的核心含义是刷新频率翻倍，而不是2x mode刷新两次可以达到1x mode刷新一次的效果。

二、切换流程(FGR->非FGR)

有FGR mode切换为非FGR mode时，要求REF次数为偶数次，因此切换流程为：

补偿未完成的刷新操作。
等待刷新完成(tRFC2)。
修改MR4[OP4]为0。

三、FGR原理

1、存储阵列物理分块

1）子阵列(Sub-Array)的划分

物理分割
DRAM存储单元(Memory Cell)被划分为多个独立的子阵列(Sub-Array)，每个子阵列包含若干行(Rows)和列(Columns)。

**典型规模：**一个Bank可能由4-8个子阵列组成，每个子阵列包含512~2048行（具体数值因工艺和密度而异）。
**示例：**在16Gb DDR5芯片中，一个Bank可能划分为8个子阵列，每个子阵列管理2K行。

行列解码本地化
每个子阵列配备独立的行解码器(Row Decoder)和列多路复用器(Column MUX)，实现局部地址解析，减少全局信号线的负载和延迟。

2）子阵列的电路隔离

电源与地线分割
子阵列间通过物理隔离的电源网格(Power Mesh)和地线(Ground Plane)供电，降低噪声耦合。
电荷泵(Charge Pump)独立
每个子阵列拥有局部电荷泵电路，快速响应刷新时的电荷恢复需求。
信号线分组
数据线(Bitline)和字线(Wordline)按子阵列分组，避免跨子阵列的长距离走线。
字线驱动优化
短距离字线减少RC延迟，提升激活(ACT)和刷新(REF)速度。

2、分块设计优势

1）并行刷新

多子阵列并发刷新：
在FGR模式下，多个子阵列可同时执行刷新操作，缩短整体刷新周期(tRFC2)。
**示例：**若普通模式需刷新整个Bank(8个子阵列)，耗时tRFC1=350ns；FGR模式下每次刷新2个子阵列，分4次完成，单次tRFC2=90ns，总耗时4×90=360ns，但每次阻塞时间更短，系统吞吐量更高。
局部电荷恢复：
每个子阵列的电荷泵和感应放大器(Sense Amplifier)仅服务局部单元，电荷补充速度更快，减少刷新对电容稳定性的依赖。
通过这两种方式可以减小刷新冲突概率，降低一个bank内刷新时的电流，以提高并行能力。这也是FGR的优势。

2）动态刷新调度

优先级队列：
刷新控制器根据行访问热度动态调度子阵列刷新顺序。
高频访问子阵列优先：
减少因刷新导致的行激活冲突(Row Hammer效应)。
冷数据子阵列延后：
结合温度监测，低温环境下适当降低刷新频率。
部分阵列自刷新(PASR)：
通过MR60配置PASR掩码，仅刷新指定子阵列，其余区域保持休眠，降低功耗。

3、实例

以某16Gb DDR5芯片为例：

Bank结构
每个Bank划分为8个子阵列，每个子阵列含2K行×512列。
刷新流程：
a.FGR 模式下，每次刷新2个子阵列(共4次完成全Bank刷新)。
b.局部电荷泵以1.8V VPP快速恢复电容电荷，单次刷新耗时tRFC2=90ns。
c.温度>85℃时，刷新控制器自动切换至2x频率（tREFI2=3.9μs），确保数据保留。

参考文献

T. Zhang, M. Poremba, C. Xu, G. Sun and Y. Xie, “CREAM: A Concurrent-Refresh-Aware DRAM Memory architecture,” 2014 IEEE 20th International Symposium on High Performance Computer Architecture (HPCA), Orlando, FL, USA, 2014, pp. 368-379, doi: 10.1109/HPCA.2014.6835947.
K. K. -W. Chang et al., “Improving DRAM performance by parallelizing refreshes with accesses,” 2014 IEEE 20th International Symposium on High Performance Computer Architecture (HPCA), Orlando, FL, USA, 2014, pp. 356-367, doi: 10.1109/HPCA.2014.6835946.