Brook+ Programming (6)

最新推荐文章于 2024-08-06 15:57:44 发布

原创最新推荐文章于 2024-08-06 15:57:44 发布 · 399 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#api #图形 #c #引擎 #编程

GPU 专栏收录该内容

6 篇文章

订阅专栏

介绍了Brook+最新版本中C++ API的主要特性，包括动态流管理、错误处理、运行域控制等，并详细阐述了这些特性如何提高GPU编程的灵活性与效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2.6 The Brook+ Runtiem API

现在版本的Brook+的特性都是完全改写了runtime引擎后的。为了提高性能和稳定性，新的C++ API提供给开发者以便能在低层用更有弹性的方式操纵GPU。

2.6.1 C++ API和之前编程模型之间的差异

差异表现在一下几个方面：

.动态流管理

.错误处理

.运行域控制

.基于异步API的显式控制

.内存阻塞

.多GPU支持

.DX互操作性

.与C++代码兼容性

接下来几节讨论这些不同之处。

2.6.1.1 动态流管理

Brook，BrookGPU和之前版本的Brook+使用静态方式分配流并且禁止为了同时读和写而对流绑定。在这个C++ API层上，没有这样的限制：

流是GPU内存的代理，可以动态分配，可以在函数之间像任何其它C++对象一样传递。

2.6.1.2 错误处理

在运行时错误被捕获并被传回客户端。在GPU端，错误相对host端的控制流可以是异步的，错误也不是直接传回host而是和流绑定并通过流图像传递。应用程序检查最后的输出来确定运行过程中是否有错误发生。

2.6.1.3 运行域控制

当使用分散流作为输出时，没有必要在输出流布局和运行域布局（运行于kernel上的虚拟“SIMD”数组）之间强行作简单的一对一映射。

2.6.1.4 基于异步API的显示控制

Brook+现在可以让你显式地让一个特定的流操作为异步的。一个API可以用来检查异步请求的状态。这样可以更好地同时使用CPU和GPU，从而提高整个系统的效率。

2.6.1.5 内存阻塞

内存阻塞利用系统允许CPU-to-GPU和GPU-to-CPU内存和用户内存之间的传递这一特性。一般情况下，数据传递时在复制到GPU或者用户内存之前，在CPU的特定内存空间会产生一个副本。内存阻塞会尽可能地提升数据传递的性能。

对内存阻塞的使用有一些开发者必须注意的限制。关于怎样在你的流操作中使用内存阻塞的详情见2.14节。

2.6.1.6 多GPU支持

多系统可以被配置为两个或更多GPU。Brook+支持开发者使用单个Brook+程序利用一个系统中所有兼容的GPU。一组例行的程序可以使用户选择程序运行的设备。关于在你的程序中怎样利用多GPU特性的详情，见2.16节。

2.6.1.7 DX互操作性

DX互操作性支持Brook+程序员很容易地、高效地将他们的计算结果用自己熟悉的图形API显示在屏幕上。这对于图形和视频处理程序特别重要。互用性使程序员在渲染和提升所有应用程序的特性之前避免产生复制回CPU端的副本。

2.6.1.8 与C++代码的兼容性

Kernel代码仍然是C的一个严格子集，但是将所有其它的代码从.br文件中移出意味着开发者可以用C++写应用程序。

博客等级

码龄17年

10
原创

0
点赞

0
收藏

36
粉丝

关注

私信

热门文章

分类专栏

C++
Erlang 3篇
GPU 6篇
Opencv
Ubuntu 1篇
杂七杂八

展开全部收起

上一篇：: 编程小妙招：取模

最新评论

Erlang 环形基准测试程序
ZhangAnam: 初学者，呵呵： -module(m). -compile(export_all). createCirc(frist,N) -> register(fristProcess , spawn(fun() -> doit() end)), [{fristProcess , N} | createCirc(N-1)]. createCirc(N) when N>1-> [{spawn(fun() -> doit() end),N} | createCirc(N-1)]; createCirc(N) when N=:=1-> [{spawn(fun() -> doit() end),1}]. doit() -> receive {[{H , Num_id} | T],Num} -> io:format("~p:~p~n",[Num_id , Num]), H ! {T , Num}, doit(); {[],Num} -> fristProcess ! {frist , Num}, doit(); {frist,Num} when Num>0-> io:format("~p:~p~n",[0 , Num]), doit(); {frist,Num} when Num=:=0-> io:format("~p:~p~n",[0 , Num]) end. loop(Process , M) when M>0-> fristProcess ! {Process , M}, loop(Process , M-1); loop(Process , M) when M=:=0-> fristProcess ! {Process , M}. wait(T) -> receive after T-> true end. main(N,M) -> helo, Process = createCirc(frist , N), wait(30), loop(Process , M).
Intel C++ 11.1 与 g++ 4.3.3 编译性能小测试
匿名用户: 回复匿名用户：能解释一下为什么这样之后就会快了呢？

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。