PyTorch--入门指南

最新推荐文章于 2025-02-10 15:41:57 发布

原创最新推荐文章于 2025-02-10 15:41:57 发布 · 243 阅读

0 ·

CC 4.0 BY-SA版权

PyTorch 同时被 2 个专栏收录

26 篇文章

订阅专栏

SiamMask

13 篇文章

订阅专栏

本文详细介绍了PyTorch中torch.device的使用，包括如何根据可用性选择CPU或CUDA设备，以及torch.backends.cudnn.benchmark的设置原则，以提升深度学习模型的运行效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1_torch.device

参考网址： https://ptorch.com/news/187.html

torch.device代表将torch.Tensor分配到的设备的对象。

torch.device包含一个设备类型（'cpu'或'cuda'设备类型）和可选的设备的序号。
如果设备序号不存在，则为当前设备;
例如，torch.Tensor用设备构建'cuda'的结果等同于'cuda:X',其中X是torch.cuda.current_device()的结果。

torch.Tensor的设备可以通过Tensor.device访问属性。

构造torch.device可以通过字符串/字符串和设备编号。

>>> torch.device('cuda:0')
device(type='cuda', index=0)

>>> torch.device('cpu')
device(type='cpu')

>>> torch.device('cuda')  # current cuda device
device(type='cuda')

在我的Siammask项目里面

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

2_torch.backend.cidnn.benchmark

参考网址： https://ptorch.com/news/187.html

torch.backend.cudnn.benchmark

大部分情况下，设置这个 flag 可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法，来达到优化运行效率的问题。

一般来讲，应该遵循以下准则：

如果网络的输入数据维度或类型上变化不大，设置 torch.backends.cudnn.benchmark = true 可以增加运行效率；
如果网络的输入数据在每次 iteration 都变化的话，会导致 cnDNN 每次都会去寻找一遍最优配置，这样反而会降低运行效率。