brook+编程之GPU加速到底多快？

最新推荐文章于 2024-11-20 15:27:22 发布

tearsofphoenix

最新推荐文章于 2024-11-20 15:27:22 发布

阅读量921

点赞数

CC 4.0 BY-SA版权

分类专栏： GPU 文章标签：编程优化算法引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/tearsofphoenix/article/details/4821177

GPU 专栏收录该内容

6 篇文章

订阅专栏

本文介绍了显卡GPU浮点运算的基本公式，并通过实例计算展示了理论峰值与实际应用中的性能表现。以AMD RV770为例，计算了其理论峰值性能，并比较了不同程序优化下GPU的实际运行效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

显卡GPU浮点运算的公式如下：

理论峰值＝流处理器数目 X 2 X 显卡核心频率

以AMD的RV770为例，10个SIMD引擎，每个SIMD有16个SPU，每个SPU有5个流核心，核心频率750MHz，带入得

理论峰值1.2Tflops。我的显卡是HD3650，算的结果是0.6Gflops。程序实际运行时，能达到20%的峰值就时很高效的了。

以计算矩阵乘法，以前一篇文章的代码运算，经过g++优化，也需要大约5秒，而选择brook+的samples里面的简单

矩阵乘法的例子，大约需要0.47秒，加速比为10左右。

用优化的分块矩阵乘法对于2048X2048规模的矩阵做乘法运算，实际的浮点运算性能大概时22Gflops。由此可见，GPU

的加速性能还是很好的，一般而言，至少有10倍的加速吧。当然，这一方面依赖于显卡硬件，还依赖于算法的设计和程序的优化。

对于我的E2140来说，10倍的加速比，还是很诱人的。

博客等级

码龄17年

10
原创

0
点赞

0
收藏

36
粉丝

关注

私信

热门文章

分类专栏

C++
Erlang 3篇
GPU 6篇
Opencv
Ubuntu 1篇
杂七杂八

展开全部收起

上一篇：: Intel C++ 11.1 与 g++ 4.3.3 编译性能小测试

下一篇：: Brook+ Programming

最新评论

Erlang 环形基准测试程序
ZhangAnam: 初学者，呵呵： -module(m). -compile(export_all). createCirc(frist,N) -> register(fristProcess , spawn(fun() -> doit() end)), [{fristProcess , N} | createCirc(N-1)]. createCirc(N) when N>1-> [{spawn(fun() -> doit() end),N} | createCirc(N-1)]; createCirc(N) when N=:=1-> [{spawn(fun() -> doit() end),1}]. doit() -> receive {[{H , Num_id} | T],Num} -> io:format("~p:~p~n",[Num_id , Num]), H ! {T , Num}, doit(); {[],Num} -> fristProcess ! {frist , Num}, doit(); {frist,Num} when Num>0-> io:format("~p:~p~n",[0 , Num]), doit(); {frist,Num} when Num=:=0-> io:format("~p:~p~n",[0 , Num]) end. loop(Process , M) when M>0-> fristProcess ! {Process , M}, loop(Process , M-1); loop(Process , M) when M=:=0-> fristProcess ! {Process , M}. wait(T) -> receive after T-> true end. main(N,M) -> helo, Process = createCirc(frist , N), wait(30), loop(Process , M).
Intel C++ 11.1 与 g++ 4.3.3 编译性能小测试
匿名用户: 回复匿名用户：能解释一下为什么这样之后就会快了呢？

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。