GPU编程葵花宝典
GPU编程模板(理解意思就好,呵呵~~):
void main()
{
1 在GPU上分配内存 即 cudaMalloc(第一参数地址指针,第二参数分配大小)
2 将主机host的数据传送到设备上 cudaMemcpy(第一参数给GPU,第二参数给主机,第三参数给大小,cudaMemHostToDevice)
3 调用Kernel函数 并行计算 (模板为:_global_<<<参数1,参数2>>> void 函数名(参数,...,参数))
4 将GPU计算的结果 返回给host cudaMemcpy(第一参数给主机,第二参数给GPU,第三参数给大小,cudaMemDeviceToHost)
5 释放开始分配的GPU内存 cudaFree()
printf("牢记这五步,你会做的很好,加油~~");
} --阿科
GPU, I came ,I conquer!!!