1. 背景与原理
在AMD ROCm平台的内存管理中,SVM(Shared Virtual Memory)允许CPU和GPU共享统一的虚拟地址空间。init_svm_apertures函数负责初始化SVM地址空间(aperture),以便后续的内存分配和映射操作。该函数支持两种模式:
-
mmap模式:直接利用操作系统的虚拟地址分配能力,适用于GFXv9及以上架构,虚拟地址空间充足。
-
reserve模式:在指定区间内预留一块连续的虚拟地址空间,适用于旧架构或特殊需求(如环境变量
HSA_RESERVE_SVM启用)。
本文重点分析reserve模式的实现原理和具体流程。
2. 实现原理与应用场景
2.1 实现原理
Reserve模式的核心目标是:在指定的base和limit区间内,预留一块足够大的、连续的虚拟地址空间,供SVM使用。
-
预留空间的大小优先为整个区间,若无法分配则逐步减半,直到满足最小要求(4GB)。
-
预留空间必须对齐到GPU的Huge Page Size,保证性能和兼容性。
-
预留空间的至少一半必须在GPU可寻址范围内,确保GPU能够访问大部分分配的SVM空间。
预留空间的实现很简单,就是mmap。当计算出起始地址和大小
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



