malloc与cudaMalloc指针传递区别

原创已于 2024-08-23 14:39:00 修改 · 442 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#推加速

于 2024-08-23 14:34:48 首次发布

AI 专栏收录该内容

14 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

malloc

在C语言中，malloc函数使用如下：

float *fpHost_A;  
fpHost_A = (float *)malloc(stBytesCount);

malloc为fpHost_A分配内存空间，返回的数据类型是void*，代表所分配内存空间的首地址

cudaMalloc

在cuda编程时，cudaMalloc与malloc有所不同：

float *fpDevice_A;  
cudaMalloc((float**)&fpDevice_A, stBytesCount);

首先在使用上，cudaMalloc要求所需分配内存的变量以参数方式进行传递；
其次使用了取地址符&，意味着取fpDevice_A指针的地址。
如果在此处仅仅只传递fpDevice_A，那么只能达到修改float类型变量的目的；
而&fpDevice_A，意味着传递了fpDevice_A指针的地址，那么就可以接收cudaMalloc函数为fpDevice_A所分配的在GPU中的内存空间的首地址。由于是指针的指针，因此在强转时，使用的是(float**)

参考资料

这两份代码在指针传递和内存分配方面有着明显的区别，主要体现在它们用于的内存类型和对应的内存分配函数上。

第一份代码：

float *fpHost_A;
fpHost_A = (float *)malloc(stBytesCount);

内存类型：这段代码在主机（Host）端分配内存。malloc函数用于在CPU的内存上分配一定大小的内存空间。
指针传递：malloc函数返回的是一个void*类型的指针，指向分配的内存的起始地址。这里通过显式类型转换(float *)将void*类型的指针转换为float*类型的指针，以便fpHost_A能够正确地作为指向浮点型数据的指针使用。在malloc的调用中，指针fpHost_A不需要取地址操作（即不需要&fpHost_A），因为malloc需要的是一个指针来接收新分配的内存地址，而不是指针的地址。

第二份代码：

float *fpDevice_A;
cudaMalloc((float**)&fpDevice_A, stBytesCount);

内存类型：这段代码在设备（Device）端（通常是GPU）分配内存。cudaMalloc是CUDA API中的一个函数，用于在GPU的内存上分配一定大小的内存空间。
指针传递：与malloc不同，cudaMalloc函数的第一个参数是一个指向指针的指针（即**），这主要是因为CUDA的API设计。cudaMalloc需要能够修改传入的指针，以便将其指向新分配的设备内存地址。因此，你需要传递指向你想要修改的指针的指针（即&fpDevice_A）。但是，这里有一个常见的陷阱，即直接传递float**可能会导致类型不匹配的错误。因此，这里通过(float**)&fpDevice_A进行了强制类型转换，将float*的指针地址（实际上是float**）转换为float**类型，以满足cudaMalloc的参数要求。注意，虽然这种转换在CUDA编程中很常见，但理论上并不完全符合C/C++的类型安全标准。