CUDA笔记2：概念理解

CUDA基本概念及编程要点解析

最新推荐文章于 2025-06-18 14:00:00 发布

原创

最新推荐文章于 2025-06-18 14:00:00 发布 · 3.6k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#cuda #并行编程

CUDA是NVIDIA提出的并行计算平台，允许CPU和GPU协同处理任务。在CUDA中，Kernel运行在GPU的Grid和Block结构上，线程通过threadIdx和blockIdx标识。GPU硬件包含Streaming Processors和Streaming Multiprocessors，存储层次包括register、local、shared、global、constant和texture memory。CUDA编程涉及内存管理、并行同步和计时，调试可借助Nsight工具。

CUDA基本概念：

CUDA全称是ComputeUnified Device Architecture，中文名称即统一计算设备架构，它是NVIDIA公司提出了一种通用的并行计算平台和编程模型。使用CUDA，我们可以开发出同时在CPU和GPU上运行的通用计算程序，更加高效地利用现有硬件进行计算。并行编程的中心思想是分而治之：将大问题划分为一些小问题，再把这些小问题交给相应的处理单元并行地进行处理。在CUDA中，这一思想便体现在Grid, Block, Thread等层次划分上。

GPU并行架构：

GPU编程中CPU被称为Host, GPU被称为Device.

Kernel函数在Host中被调用，在Device中被执行。

一个Kernel对应一个Grid;

一个Grid包含一组Block,Block在Grid中的分布可以是一维，二维或三维的，具体由GridDim定义，每个Block都有各自的ID,记blockIdx.xyz;

一个Block包含一组Thread,Thread在Block中的分布有BlockDim定义，每个

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。