30、CnC - CUDA:面向GPU的声明式编程

CnC - CUDA:面向GPU的声明式编程

1. CnC - CUDA基础操作

在CnC - CUDA中,存在一些关键的操作和特性。
- 调用阻塞 :一个调用会阻塞,直到所有已启动的CUDA内核返回,并且它们的输出被放置在主机内存中。
- Tag Collections操作
- PutRegion操作 :将整数标签区域放入标签集合。一旦所需项可用,它会立即为范围内的所有标签启动一个CUDA内核。
- 单个标签Put操作 :标签集合会等待达到阈值数量(当前经验设定为8192个标签)的标签放入,然后使用这些标签及其关联项启动一个CUDA内核。当所有标签都放入GPU标签集合后,程序员需要调用该标签集合的 Wait() 函数,以确保所有CUDA线程都已完成,因为设备内存的数据传输和CUDA内核的启动由单独的CPU线程处理。
- 二维标签定义 :对于更高级的CUDA程序员,可以定义二维标签: <int tag:two region> ,这允许在图上放置具有2个区域的标签,这两个区域将被解释为内核启动时每个网格的块数和每个块的线程数。还可以通过使用 -t <线程数> 标志编译图文件来指定块中所需的线程数。
- One - For - All (OFA)属性 :支持项集合的OFA属性,格式为 [int item:ofa

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值