#include <stdio.h>
__global__ void hello_world(void)
{
printf("GPU: Hello GPU\n"); // GPU输出的Hello GPU
}
int main(int argc, char **argv)
{
printf("CPU: Hello CPU\n"); // CPU输出的Hello CPU
hello_world<<<1, 20>>>();
cudaDeviceReset(); // 包含隐式同步,如果没有这一行就看不到GPU输出的Hello GPU
return 0;
}
C++ 最简单的CUDA代码
于 2023-09-08 15:30:09 首次发布
这篇文章展示了如何在C++中使用CUDA进行并行编程,定义了一个全局函数hello_world在GPU上运行,同时CPU输出HelloCPU,通过`cudaDeviceReset()`实现同步,确保GPU输出可见。
部署运行你感兴趣的模型镜像
您可能感兴趣的与本文相关的镜像
PyTorch 2.5
PyTorch
Cuda
PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

1946

被折叠的 条评论
为什么被折叠?



