流水线并行选择大小batch的影响、作用

转载已于 2023-11-16 17:25:22 修改 · 204 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：https://blog.youkuaiyun.com/weixin_47364682/article/details/120408451

文章标签：

#batch #开发语言

于 2023-11-15 17:09:10 首次发布

流水线并行专栏收录该内容

2 篇文章

订阅专栏

本文探讨了在使用流水线并行处理小型数据时，如何通过调整微批次大小来平衡GPU效率和性能。过小的微批次可能导致GPU未充分利用，而分区间的不平衡也会影响整体性能，关键在于优化最慢分区的处理策略。

罗西的思考这个大佬是原创，这篇只是为了方便我自己记忆和后期查找

基本上，流水线并行是一个小型数据并行的栈。当每个分区处理完一个微批次后，它可以将输出抛到下一个分区并立即开始下一个微批次的工作，这样分区就可以重叠。

通过选择较小尺寸的微批次，可以减少“bubble"。但通常，较大的批量可以更有效地利用GPU。

因此，如果选择的微批量太小，GPU可能未得到充分利用。另外，更快的分区应该等待相邻的较慢分区，分区之间的不平衡也可能导致GPU利用率不足。因此，总体性能由最慢的分区决定。

评论 1

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。