SUA(System Unified Address )原理分析-优快云博客

CPU与外设的统一虚拟地址寻址是OpenCL SVM的基石，为OpenCL和AI计算编程提供了生产力工具。

在 AMD64 和 IA64 架构中，虽然理论上提供了 64 位（2^64 ≈ 18.4 亿 TB）的虚拟地址空间，但 CPU 实际仅使用其中的一部分：

低地址区域：VA[63:47] = 0（0x00000），覆盖地址范围 0x0000 0000 0000 ~ 0x0000 FFFF FFFF（约 256TB）
高地址区域：VA[63:47] = 0x1FFFF（全 1），覆盖地址范围 0xFFFF 0000 0000 ~ 0xFFFF FFFF FFFF（约 256TB）
中间区域：VA [63:47] 为 0x00001 ~ 0x1FFFE 的范围，这部分地址空间被称为空洞（Hole），CPU 无法直接访问。

因此，实际有效的虚拟地址宽度为 48 位（2^48 ≈ 256TB），这是硬件设计的限制，而非软件限制。

这种设计主要出于以下考虑：

在 SUA（系统统一寻址）模式下，GPU 会将自己的GPUVM 地址空间（40 位，2^40 ≈ 1TB）映射到这个空洞区域：

GPUVM 的 40 位地址被扩展为 64 位，高 17 位（VA [63:47]）通常设置为 0x00001 或其他未被 CPU 使用的值。
例如，GPUVM 地址 0x0000 0000 1234 可能被映射为 64 位地址 0x0000 1000 0000 1234，落在空洞区域内。

这样，GPU 可以同时访问：

假设 GPU 要访问一个 64 位地址 0x0000 1000 0000 1234：

判断地址归属：检查高 17 位（VA [63:47] = 0x00001），发现属于 GPUVM 空洞区域。
地址压缩：
- 从 64 位地址中减去GPUVM_Base（例如 0x0000 1000 0000 0000），得到 40 位相对地址 0x0000 0000 1234。
- 设置ATC 位 = 0，表示使用 GPUVM 页表。
地址转换：通过 GPUVM 页表将 40 位地址转换为物理地址。