CUDA:简单打印的实例 C/C++
#include <stdio.h>
#include <cuda_runtime.h>
__global__ void simplePrint()
{
printf("Hello from GPU!\n");
}
int main()
{
// 调用 CUDA 设备初始化
cudaFree(0);
// 定义 GPU 核心数量
int numBlocks = 1;
int numThreadsPerBlock = 1;
// 在 GPU 上执行打印函数
simplePrint<<<numBlocks, numThreadsPerBlock>>>();
// 同步 GPU,等待所有核心执行完毕
cudaDeviceSynchronize();
// 输出完成信息
printf("Print complete!\n");
return 0;
}
在本示例中,我们将展示如何使用 CUDA 在 GPU 上执行简单的打印操作。CUDA(Compute Unified Device Architecture)是一种并行计算平台和编程模型,使我们能够在 NVIDIA 的 GPU 上直接进行并行计算。
首先,我们需要包含 <stdio.h> 和 <cuda_runtime.h> 头文件,分别用于标准输入输出和 CUDA 运行时库。
接下来,我们
本示例展示了如何在CUDA环境下使用C/C++在GPU上执行简单的打印操作。通过包含必要的头文件,定义CUDA核函数,初始化CUDA设备,设置线程块和线程数,调用函数并同步GPU,实现GPU上的并行打印。CUDA为高性能并行计算提供了更多可能。
订阅专栏 解锁全文
2937

被折叠的 条评论
为什么被折叠?



