PyTorch笔记详解大全(持续更新ing...)

这篇博客介绍了PyTorch中的自动混合精度训练、自动梯度机制,以及如何排除子图不参与反向传播。讨论了CPU线程、CUDA语义和分布式数据并行训练。重点讲解了如何扩展PyTorch,包括autograd、nn模块和编写C++扩展。此外,还强调了训练过程中的可复现性,包括控制随机源、避免非确定性算法,确保CUDA卷积的确定性,并给出了相关代码示例。
部署运行你感兴趣的模型镜像

诸神缄默不语-个人优快云博文目录

原文档地址:PyTorch documentation — PyTorch 1.11.0 documentation

1. Automatic Mixed Precision examples

2. Autograd mechanics

原文档

2.1 Excluding subgraphs from backward

Tensor属性requires_grad。
Tensor生成时requires_grad一般默认为False。
在计算图中,只有所有叶节点的requires_grad都是False时,整个树才不计算梯度。
在需要冻结部分模型或者确知某些参数不需要计算梯度时可以设置requires_grad为False,比如使用预训练模型时可以冻结其他参数、只计算仿射层参数的梯度并更新参数,输出也需要梯度。
示例代码:

model = torchvision.models.resnet18(pretrained=True)
for param in model.parameters():
    param.requires_grad = False
# Replace the last fully-connected layer
# Parameters of newly constructed modules have requires_grad=True by default
model.fc = nn.Linear(512, 100)

# Optimize only the classifier
optimizer = optim.SGD(model.fc.parameters(), lr=1e-2, momentum=0.9)

注意示例代码中注释说新构建的网络层参数会默认设置requires_grad为True,因此在真实实验中整个网络的参数往往是需要计算梯度的,所以训练时可以正常使用优化器,而在验证和测试时需要冻结参数

3. Broadcasting semantics

4. CPU threading and TorchScript inference

5. CUDA semantics

6. Distributed Data Parallel

7. Extending PyTorch

7.1 Extending torch.autograd

7.2 Extending torch.nn

7.3 Extending torch

7.4 Writing custom C++ extensions

7.5 Writing custom C extensions

8. Frequently Asked Questions

9. Features for large-scale deployments

10. Modules

11. Multiprocessing best practices

12. Reproducibility可复现性

12.1 Controlling sources of randomness

12.1.1 PyTorch random number generator

示例代码:

import torch
torch.manual_seed(0)

12.1.2 Python

示例代码:

inport random
random.seed(0)

12.1.3 Random number generators in other libraries

NumPy示例代码:

import numpy as np
np.random.seed(0)

注意,有些应用和库要用到NumPy Random Generator object而不是这个global RNG,总之情况还挺复杂。

12.1.4 CUDA convolution benchmarking

使用torch.backends.cudnn.benchmark = False来禁用这个过程,可能会使结果变差。

12.2 Avoiding nondeterministic algorithms

12.2.1 CUDA convolution determinism

12.2.2 CUDA RNN and LSTM

12.3 DataLoader

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

诸神缄默不语

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值