编程,语言,java,web,程序,软件,C++,C#,互联网,网络
NVIDIA CUDA 编程指南
NVIDIA 技术文档 (全译文)
Jan. 2008
Version 1.1
GPU系列技术文档1
NVIDIA CUDA 编程指南1
Chapter1 介绍CUDA……11
1.1 作为一个并行数据计算设备的图形处理器单元…………………………11
1.2 CUDA: 一个在GPU上计算的新架构12
Chapter2 编程模型 15
2.1 一个超多线程协处理器15
2.2 线程批处理15
2.2.1 线程块16
2.2.2 线程块栅格16
2.3 内存模型17
Chapter3 硬件实现18
3.1 一组带有on-chip共享内存的SIMD 多处理器18
3.2 执行模式19
3.3 计算兼容性20
3.4 多设备20
3.5 模式切换20
Chapter4 应用程序编程接口 (API ) 21
4.1 一个C语言的扩展21
4.2 语言扩展21
4.2.1 函数类型限定词 22
4.2.1.1 __device__22
4.2.1.2 __global__22
4.2.1.3 __host__22
4.2.1.4 限定22
4.2.2 变量类型限定词23
4.2.2.1 __device__23
4.2.2.2 __constant__ 23
4.2.2.3 __shared__23
4.2.2.4 限定24
4.2.3 执行配置25
4.2.4 内置变量26
4.2.4.1 gridDim 26
4.2.4.2 blockIdx26
4.2.4.3 blockDim26
- 2 -
4.2.4.4 threadIdx 26
4.2.4.5 限定 26
4.2.5 NVCC编译 26
4.2.5.1 __noinline__ 27
4.2.5.2 #pragmaunroll 27
4.3 公共Runtime 组件 28
4.3.1 内置矢量类型 28
4.3.1.1
char1,uchar1,char2,uchar2,char3,uchar3,char4,uchar4,short1,ushort1,short2,us
hort2,short3,ushort3,short4,ushort4,int1,uint1,int2,uint2,int3,uint3,int4,ui
nt4,long1,ulong1,long2,ulong2,long3,ulong3,long4,ulong4,float1,float2,float3
,float4 28
4.3.1.2 dim3 类型 28
4.3.2 数学函数 28
4.3.3 时间函数 28
4.3.4 纹理类型 29
4.3.4.1 Texture Reference 声明29
4.3.4.2 RuntimeTexture Reference 属性30
4.3.4.3 线性内存纹理操作对比CUDA数组31
4.4 设备Runtime 组件 31
4.4.1 数学函数 31
4.4.2 同步函数 31
4.4.3 类型转换函数 32
4.4.4 TypeCasting 函数32
4.4.5 纹理函数 33
4.4.5.1 设备内存纹理操作33
4.4.5.2 CUDA 数组纹理操作33
4.4.6 原子函数 34
4.5 主机Runtime 组件 34
4.5.1 公共概念 35
4.5.1.1 设