CUDA programming——Programming Model

最新推荐文章于 2024-09-25 15:09:25 发布

Chen.Yi

最新推荐文章于 2024-09-25 15:09:25 发布

阅读量225

点赞数

分类专栏： CUDA Programming

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_43211438/article/details/108830656

版权

CUDA Programming 专栏收录该内容

1 篇文章

订阅专栏

Kernels

用__global__来定义，用<<<…>>>来指明使用的CUDA线程数量，执行这个kernel的每一个线程都会有一个独特的thread ID，可以在kernel内部通过内置变量得到。

// Kernel definition
__global__ void VecAdd(float* A, float* B, float* C)
{
int i = threadIdx.x;
C[i] = A[i] + B[i];
}
int main()
{
...
// Kernel invocation with N threads
VecAdd<<<1, N>>>(A, B, C);
...
}

Thread Hierarchy

index of a thread 和 thread ID

一维block
二者相等

二维block
size=(Dx,Dy)
thread index =（x,y)
thread ID = x + y*Dx

三维block
size = (Dx,Dy,Dz)
thread index = (x,y,z)
thread ID = x + yDx + zDx*Dy

Grid of Thread Blocks

在这里插入图片描述
thread index.x = blockIdx.x * blockDim.x + threadIdx.x
thread index.y = blockIdx.y * blockDim.y + threadIdx.y

// Kernel definition
__global__ void MatAdd(float A[N][N], float B[N][N],
float C[N][N])
{
int i = blockIdx.x * blockDim.x + threadIdx.x;
int j = blockIdx.y * blockDim.y + threadIdx.y;
if (i < N && j < N)
C[i][j] = A[i][j] + B[i][j];
}
int main()
{
...
// Kernel invocation
dim3 threadsPerBlock(16, 16);
dim3 numBlocks(N / threadsPerBlock.x, N / threadsPerBlock.y);
MatAdd<<<numBlocks, threadsPerBlock>>>(A, B, C);
...
}

Memory Hierarchy
在这里插入图片描述

博客等级

码龄7年

27
原创

36
点赞

323
收藏

49
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: kitti数据集仅velodyne数据转rosbag

下一篇：: ceres库编译不通过

最新评论

3D点云分割论文总结
Alanthk: 当β>θ时，应该判定这两个点属于同一个物体。这种关键性问题都能搞错。
kitti数据集仅velodyne数据转rosbag
boyboy1254: 老哥，他这个times.txt文件在哪下载啊
kitti数据集仅velodyne数据转rosbag
SnakeTC-茄茄: 一定记得要在kitti官网下载两个文件先 1.velodyne laser data 这个里面包含必须的velodyne数据 2.carlibration files 这个文件里包含必须的times.txt 把这两个必须的文件放在00文件夹下面再执行github上说的命令才可以转换成功
3D点云分割论文总结
tsk方方土: “因此，可以设置一个阈值θ，当β>θ时，就判定这两个点不属于同一个物体。”这里应该是属于同一物体？
ceres库编译不通过
请叫我李青大人: lq@lq-virtual-machine:~$ sudo apt-get install -y g++-5.5 正在读取软件包列表... 完成正在分析软件包的依赖关系树正在读取状态信息... 完成 E: 无法定位软件包 g++-5.5 E: 无法按照 glob ‘g++-5.5’ 找到任何软件包 E: 无法按照正则表达式 g++-5.5 找到任何软件包 lq@lq-virtual-machine:~$ sudo apt-get install -y gcc-5.5 正在读取软件包列表... 完成正在分析软件包的依赖关系树正在读取状态信息... 完成 E: 无法定位软件包 gcc-5.5 E: 无法按照 glob ‘gcc-5.5’ 找到任何软件包 E: 无法按照正则表达式 gcc-5.5 找到任何软件包请问博主这是什么原因

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。