[cgdc12][amd]DirectCompute的应用

最新推荐文章于 2017-01-04 16:38:36 发布

原创最新推荐文章于 2017-01-04 16:38:36 发布 · 4.3k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#shader #filter #工具

Engine&Render 专栏收录该内容

242 篇文章

订阅专栏

本文由AMD高级工程师冉锦撰写，重点介绍了DirectCompute技术及其在实时渲染领域的应用趋势。文中详细解释了概念线程组（wave）的概念，并指出为了充分利用GPU资源，线程组的数量应该为wave计算单元的整数倍。此外，还强调了共享内存的重要性，特别是对于大型内核滤波器等计算任务来说，使用DirectCompute可以通过共享临近像素的计算结果或内存收集情况来提高效率。

cgdc12的一个文章，amd的高级工程师:冉锦,带来。

着重介绍direct compute的一些东西，DirectCompute可以说是realtime rendering后面的一个重要趋势。

概念

线程组：

GPU里面是以一组计算单元为单位来运行的，amd称之为wave，是显卡并行的最小单元，如果wave是32个计算单元，那么用了一个8线程的运算，就会造成24线程的浪费

DirectCompute都是以线程组的方式来并行做的，那么在确认线程组数量的时候需要是wave计算单元的整数倍，才不会造成浪费。

共享内存：

每个wave里面有一个共享内存，最大是64kb，这个可以说是DirectCompute比传统的shader计算更快的一个重要地方。

工具

amd提供了GPUPerfStudio2来做debug和profile工具。

DirectCompute优势计算类型

就是可以利用上共享内存的计算类型，比如说是需要一个大kernel的filter类，pixel shader里面没有共享内存，每个fragment要自己收集足够信息。

而在direct compute里面可以把临近的pixel的计算结果或者内存的收集情况进行共享。

围绕这点，可以有：

大kernel的gaussian blur
dof
HDAO的bilateral filter
基于tile的光照剪切

评论 2

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。