#include<iostream>
#include<cuda.h>
#include<cuda_runtime.h>
#include<time.h>
#include<math.h>
using namespace std;
const int Num=10000000;
const int threads=256;
const int blocks=2048;
__global__ void kernel(int* a,int* b,int* c)
{
const int tid=blockIdx.x*blockDim.x+threadIdx.x;
for(long i=tid;i<Num+gridDim.x*blockDim.x;i+=gridDim.x*blockDim.x)
{
if(i<Num)
{
//a[i]=(int)sqrtf(b[i])%(int)sqrtf(c[i]);
a[i]=b[i]%c[i];
}
}
}
int main(void)
#include<cuda.h>
#include<cuda_runtime.h>
#include<time.h>
#include<math.h>
using namespace std;
const int Num=10000000;
const int threads=256;
const int blocks=2048;
__global__ void kernel(int* a,int* b,int* c)
{
const int tid=blockIdx.x*blockDim.x+threadIdx.x;
for(long i=tid;i<Num+gridDim.x*blockDim.x;i+=gridDim.x*blockDim.x)
{
if(i<Num)
{
//a[i]=(int)sqrtf(b[i])%(int)sqrtf(c[i]);
a[i]=b[i]%c[i];
}
}
}
int main(void)

该博客通过一个CUDA程序展示了如何测试GPU的加速比。作者创建了一个CUDA内核函数`kernel`,并用它来计算两个大型整数数组的模运算。在CPU和GPU上分别执行相同的操作,并记录耗时,然后计算加速比。最后,还进行了结果的验证以确保GPU计算的正确性。
最低0.47元/天 解锁文章
5399

被折叠的 条评论
为什么被折叠?



