PyCUDA线程和块

最新推荐文章于 2025-03-20 14:51:30 发布

原创最新推荐文章于 2025-03-20 14:51:30 发布 · 318 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #cuda

PyCUDA 专栏收录该内容

10 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

import pycuda.driver as cuda
import pycuda.autoinit
from pycuda.compiler import SourceModule

mod = SourceModule("""
    #include <stdio.h>

     __global__ void myfirst_kernel()
       {
        printf("I am in block no: %d \\n", blockIdx.x);
      }
""")
 
function = mod.get_function("myfirst_kernel")
function(grid=(10,1),block=(1,1,1))

从代码中可以看出，我们正在启动一个有10个并行线程块的内核，每个块都只有一个线程，在内核代码中打印内核执行的块 ID，可以把它视为是并行执行10个myfirst_kernel的副本，每个副本都有个唯一的线程块ID(可直接访问的blockIdx.x）和唯一的线程ID(可直接访问的threadldx.x)，这些ID将告诉我们哪个块和线程正在执行内核。多次运行该程序时，将发现每次都会以不同顺序执行。

您可能感兴趣的与本文相关的镜像