An Even Easier Introduction to CUDA
CUDA简介
CUDA
是
NVIDIA
的
GPGPU
模型,它使用
C
语言为基础,可以直接以大多数人熟悉的
C
语言,写出在显示芯片上执行的程序,而不需要去学习特定的显示芯片的指令或是特殊的结
构。
在
CUDA
的架构下,一个程序分为两个部份:
host
端和
device
端。
Host
端是指在
CPU
上
执行的部份,而
device
端则是在显示芯片上执行的部份。
Device
端的程序又称为
"kernel"
。
通常
host
端程序会将数据准备好后,复制到显卡的内存中,再由显示芯片执行
device
端程
序,完成后再由
host
端程序将结果从显卡的内存中取回
在
CUDA
架构下,显示芯片执行时的最小单位是
thread
。数个
thread
可以组成一个
block
。
一个
block
中的
thread