cuda 内存结构
设备内存:
1 全局内存,通过CUDA内核指针访问
2 常量内存,只读
本地内存,
纹理内存,(CUDA数组形式)通过纹理与表面加载/存储指令访问
CPU GPU之间复制数组
cudaMemcpy(sendbuff[i], h_arr, size*sizeof(float), cudaMemcpyHostToDevice); //将数据从CPU传递到GPU
cudaMemcpy(recvCPU, sendbuff[i], sizeof(float) * size, cudaMemcpyDeviceToHost); //将数据从cuda 拷贝到cpu