CUDA进阶第五篇-如何估算出程序的GPU加速比

最新推荐文章于 2024-04-29 13:34:21 发布

原创最新推荐文章于 2024-04-29 13:34:21 发布 · 6.3k 阅读

12 ·

CC 4.0 BY-SA版权

CUDA进阶专栏收录该内容

12 篇文章

订阅专栏

本文介绍了GPU加速比预估的经验，重点讲述了阿姆达尔定律的应用，并提供了不同场景下的加速比估算方法。

当对一个程序进行加速的时候，很多时候需要预估出程序使用GPU加速后的加速比（比如你老板不懂GPU，或者甲方会问你预估加速比等等）。从大二接触GPU加速，到现在大概有6年时间，大大小小的项目也做了十几个，很多时候都需要事先回答加速比会有多少这个问题。这里简单的说一下自己的经验，欢迎各位大神指点。

文中的经验基于目前主流的显卡，比如GTX1080，最低也得是GTX9**系列的。

1.阿姆达尔定律

谈加速比，首先要先明白一个定律-阿姆达尔定律。该定律一般应用与CPU加速，可以总结为一句话-程序中可并行代码的比例决定你增加处理器（总核心数）所能带来的速度提升的上限。

应用在GPU加速情景上比较简单，假设程序S由A和B两个步骤组成，现在对A步骤进行GPU加速，那么GPU加速比=A步骤加速前的时间/A步骤加速后的时间，而不是加速前S的总时间/加速后S的总时间。这个非常重要，因为很多人不懂GPU加速，他们往往只关注整个程序的加速效果。而对于一个完整的程序，很多都包括一些非常耗时的操作（比如读取图片等）。这种情况下就算你对程序中的某个步骤使用GPU加速到极致，整个程序可能只感觉快了一点点，这是非常不公平的。