PyTorch笔记详解大全（持续更新ing...）

原创已于 2022-06-28 14:16:09 修改 · 690 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #pytorch #深度学习 #神经网络 #机器学习

于 2021-05-24 14:35:17 首次发布

人工智能学习笔记专栏收录该内容

277 篇文章

订阅专栏

这篇博客介绍了PyTorch中的自动混合精度训练、自动梯度机制，以及如何排除子图不参与反向传播。讨论了CPU线程、CUDA语义和分布式数据并行训练。重点讲解了如何扩展PyTorch，包括autograd、nn模块和编写C++扩展。此外，还强调了训练过程中的可复现性，包括控制随机源、避免非确定性算法，确保CUDA卷积的确定性，并给出了相关代码示例。

部署运行你感兴趣的模型镜像

诸神缄默不语-个人优快云博文目录

原文档地址：PyTorch documentation — PyTorch 1.11.0 documentation

1. Automatic Mixed Precision examples

2. Autograd mechanics

原文档

2.1 Excluding subgraphs from backward

Tensor属性requires_grad。
Tensor生成时requires_grad一般默认为False。
在计算图中，只有所有叶节点的requires_grad都是False时，整个树才不计算梯度。
在需要冻结部分模型或者确知某些参数不需要计算梯度时可以设置requires_grad为False，比如使用预训练模型时可以冻结其他参数、只计算仿射层参数的梯度并更新参数，输出也需要梯度。
示例代码：

model = torchvision.models.resnet18(pretrained=True)
for param in model.parameters():
    param.requires_grad = False
# Replace the last fully-connected layer
# Parameters of newly constructed modules have requires_grad=True by default
model.fc = nn.Linear(512, 100)

# Optimize only the classifier
optimizer = optim.SGD(model.fc.parameters(), lr=1e-2, momentum=0.9)