
cuda
文章平均质量分 51
烤又拌饭
这个作者很懒,什么都没留下…
展开
-
手把手安装Nsight system
在网上看了各种各样的安装教程之后,作为一个新手,打算自己写一个安装Nsight system教程,简单记录一下,过程十分简易其实。对照各位自己的实际情况,我是红框的这种。本地为windows,远程为linux。后面还有System Requirements,确保自己的条件符合。之后使用和其他具体分析步骤详见。先别着急打开下载,先看一下下边的支持矩阵。确定了自己要下载哪一版之后,回到最上面。,点击Get Started。进来之后可以看到一系列的选项。原创 2025-02-14 09:43:25 · 561 阅读 · 0 评论 -
CUDA学习(2)在CUDA核函数中使用线程索引
内核中的每个线程都有唯一的标识或索引。因为我们在执行配置>中使用了两个数字(grid size和block size),所以内核中的每个线程也应该由两个数字标识。在内核中,grid size和block size存储在内置变量gridDim.x和blockDim.x中。例如一个核函数调用的执行配置为,我们就知道grid size的gridDim.x为10000,block size的blockDim.x等于256。原创 2024-12-16 23:05:02 · 277 阅读 · 0 评论 -
CUDA学习(1)CUDA编程的基本知识
出于个人兴趣和需要,最近接触了GPU编程。于是想写篇文章(或者是一系列的),来总结一下学习所得,防止自己以后忘了,健忘是这样的。前置知识:在GPU中:kernel代表一个计算任务,一个计算任务可以被分成多个block (block是软件层面上的概念),一个block中包含多个thread。原创 2024-12-16 22:42:22 · 274 阅读 · 0 评论