
CUDA
xholes
这个作者很懒,什么都没留下…
展开
-
CUDA C编程手册:硬件实施
CUDA C编程手册:硬件实施SIMT 架构硬件多线程SIMT 架构硬件多线程原创 2020-08-29 15:43:59 · 613 阅读 · 0 评论 -
CUDA C编程手册: 编程接口(七)
CUDA C编程手册: 编程接口(七)运行时图形交互OpenGL 交互Direct3D交互SLI 交互运行时图形交互一些来自其他软件的资源, 如OpenGL, Direct3D 可以映射至CUDA的地址空间。 这样CUDA 就可读取由其他程序所写的数据, 同时也能产出可以供它们使用的数据。在将资源映射至CUDA的地址空间之前,它必须使用一些API中的函数来先进行注册。这些函数会返回一个指向CUDA图形资源struct cudaGraphicsResource的指针。注册资源会有很高的overhead原创 2020-06-20 13:20:00 · 841 阅读 · 0 评论 -
CUDA C编程手册: 编程接口(六)
CUDA C编程手册: 编程接口(六)CUDA C 运行时表面内存表面对象API表面引用APICubemap 表面Cubemap Layered 表面CUDA 数组读写一致性CUDA C 运行时表面内存对于计算力高于2.0的设备,使用cudaArraySurfaceLoadStore标志创建的CUDA数组, 可以通过surface object.或者surface reference进行读写。不同的设备,所支持的表面内存的大小是不一样的。表面对象API表面对象的描述可以使用struct cudaR原创 2020-06-20 09:10:29 · 521 阅读 · 0 评论 -
CUDA C编程手册: 编程接口(五)
CUDA C编程手册: 编程接口(五)CUDA C 运行时纹理内存和表面内存纹理内存CUDA C 运行时纹理内存和表面内存CUDA支持使用一小部分GPU用于图形显示的纹理硬件来对纹理内存和表面内存进行访问。相比于从全局内存,从纹理或者表面内存中读取数据的在之前的设备内存章节已经进行了介绍。有两类API 用来完成对纹理和表面内存进行使用: 纹理引用API在所有的设备都能使用; 纹理对象API只支持在计算力大于3.0的设备上使用。 纹理引用API有一些纹理对象API所有没有的限制,使用时需要有所注意。原创 2020-06-17 22:31:06 · 719 阅读 · 0 评论 -
CUDA C编程手册: 编程接口(四)
CUDA C编程手册: 编程接口(四)CUDA C 运行时多设备系统设备枚举设备选取流与事件的行为点对点内存访存统一虚拟内存地址空间进程间通信错误校验CUDA C 运行时多设备系统设备枚举一个主机系统可以拥有多个设备。下列代码演示了如何枚举这些设备, 查询它们的属性以及确定激活的设备数量。int deviceCount;cudaGetDeviceCount(&deviceCount);int device;for (device = 0; device < deviceCoun原创 2020-06-08 07:52:19 · 2611 阅读 · 0 评论 -
CUDA C编程手册: 编程接口(三)
CUDA C编程手册: 编程接口(三)CUDA C 运行时CUDA C 运行时原创 2020-06-06 17:11:30 · 885 阅读 · 0 评论 -
CUDA C编程手册: 编程接口(二)
CUDA C编程手册: 编程接口(二)CUDA C 运行时CUDA C 运行时原创 2020-05-31 18:45:37 · 431 阅读 · 0 评论 -
CUDA C编程手册: 编程接口(一)
CUDA C编程手册: 编程接口(一)引言NVCC编译编译工作流离线编译即时编译二进制兼容性PTX兼容性应用兼容性C/C++兼容性64位兼容性引言CUDA C 简单的编程方法,它与C语言编程非常相似,可以很快地写出在设备上运行的程序。它由一些小的C语言扩展和一个运行时库组成。核心的编程扩展已经在编程模型中有了介绍。这些扩展可以使得程序员定义C形式的核函数,且利用一些新的语法来指明网格和块的维度。任何使用了这些扩展的源文件必须使用NVCC编译器来编译。运行时库提供的C函数可以在主机端执行,包括内存的分原创 2020-05-20 00:00:11 · 629 阅读 · 0 评论 -
CUDA C编程手册: 编程模型
CUDA C编程手册: 编程模型核函数线程体系内存体系异构编程核函数CUDA C 是对C的一中扩展, 允许程序员定义自己的C函数, 并且将之称为 核。与传统C函数不同的是, 这样的核被调用的时候, 会被CUDA 线程并行地执行N次。核函数定义的时候使用 _global_声明标识符。同时, 在调用这样的核函数的时候, 会使用一个特定的语法<<< … >>>来指定执行的配置。每一个线程执行这个核函数的时候, 都会被分配一个独一无二的线程ID, 这个线程ID可以通过内原创 2020-05-18 22:59:41 · 433 阅读 · 0 评论