一、CUDA架构
在之前的图形处理架构中,计算资源划分为顶点着色器和像素着色器,而CUDA架构则不同,它包含了一个统一的着色器流水线,使得执行通用计算的程序能够对芯片上的每个数学逻辑单元ALU进行排列,由于NVIDIA希望使新的图形处理器能适用于通用计算,因此在实现ALU时都确保他们满足IEEE单精度浮点数学运算的需求,并且可以使用一个裁剪后的指令集来执行通用计算,而不是仅限于执行图形计算,此外GPU上的执行单元不仅能任意的读写读写内存,同时还能访问由软件管理的缓存,也成为共享内存,CUDA架构的所有这些功都是为了使GPU不仅能执行传统的图形计算,还能执行高效的通用计算。