关于深度学习GPU相关问题总结

最新推荐文章于 2025-05-27 19:46:18 发布

土豆打工仔

最新推荐文章于 2025-05-27 19:46:18 发布

阅读量1k

点赞数 13

文章标签：深度学习人工智能

本文链接：https://blog.youkuaiyun.com/weixin_51278988/article/details/135575691

版权

本文讨论了GPU内存占用率的影响因素，如模型大小和batchsize，以及如何通过调整batchsize和优化数据加载器（如使用PyTorch的DataLoader设置）来提高GPU利用率。同时，也强调了合理设置CPU线程数(num_workers)和使用pin_memory的重要性，以避免CPU和GPU间的瓶颈问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. GPU内存占用率问题

这往往是由于模型的大小以及batch size的大小，来影响这个指标。当你发下你的GPU占用率很小的时候，比如40%，70%，等等。此时，如果你的网络结构已经固定，此时只需要改变batch size的大小，就可以尽量利用完整个GPU的内存。GPU的内存占用率主要是模型的大小，包括网络的宽度，深度，参数量，中间每一层的缓存，都会在内存中开辟空间来进行保存，所以模型本身会占用很大一部分内存。其次是batch size的大小，也会占用影响内存占用率。batch size设置为128，与设置为256相比，内存占用率是接近于2倍关系。当你batch size设置为128，占用率为40%的话，设置为256时，此时模型的占用率约等于80%，偏差不大。所以在模型结构固定的情况下，尽量将batch size设置大，充分利用GPU的内存。（GPU会很快的算完你给进去的数据，主要瓶颈在CPU的数据吞吐量上面。）

2. GPU利用率问题

这个是Volatile GPU-Util表示，当没有设置好CPU的线程数时，这个参数是在反复的跳动的，0%，20%，70%，95%，0%。这样停息1-2 秒然后又重复起来。其实是GPU在等待数据从CPU传输过来，当从总线传输到GPU之后，GPU逐渐起计算来，利用率会突然升高&

最低0.47元/天解锁文章