Backto PyTorch Index
Flags
torch.backends.cudnn.benchmark = true: 让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法,来达到优化运行效率的问题。应该遵循以下准则:- 如果网络的输入数据维度或类型上变化不大,设置 torch.backends.cudnn.benchmark = true 可以增加运行效率;
- 如果网络的输入数据在每次 iteration 都变化的话,会导致 cnDNN 每次都会去寻找一遍最优配置,这样反而会降低运行效率。
博客介绍了在PyTorch中利用内置cuDNN的auto - tuner优化运行效率的准则。若网络输入数据维度或类型变化不大,设置torch.backends.cudnn.benchmark = true可提升效率;若输入数据每次迭代都变化,这样做反而会降低效率。
322

被折叠的 条评论
为什么被折叠?



