关于对CUDA计算块的理解
CUDA 计算块
对cuda计算的分块一直不是很理解,有时候还会报错。现在对不同的参数整理、理解一下,以加法加速为例。
首先是核函数的定义与实现:
__global__ void addKernel(int *c, const int *a, const int *b)
{
int i = threadIdx.x;
c[i] = a[i] + b[i];
}
再定义需要相加的两个数组以及存储结果的数组:
const int arraySize = 5;
const int
原创
2021-11-29 11:17:29 ·
293 阅读 ·
0 评论