关于Pytorch的create_graph和retain_graph的一点小得

在Pytorch中,张量计算形成计算图,反向传递(backward())通常会删除图。若要保留图以求二阶导,需使用autograd.grad并设置create_graph=True。retain_graph=True则用于在不删除计算图的情况下进行多次反向传播。
部署运行你感兴趣的模型镜像

首先我们要搞清一个逻辑,就是在Pytorch中,张量间的计算产生计算图,而反向传递会导致计算图删除(反向即backward()函数,请注意,用autograd求导不会导致计算图被删除)。

当我们想求二阶导时,用autograd.grad是执行了一次前向运算,但该函数默认不会保存计算图,因此并没有求导运算的过程,无法再继续用结果求二阶导。因而需要create_graph=True来手动建立计算图。

此外,retain_graph是retain当前的式子的计算图,当我们不想让backward()函数释放掉当前计算图时,我们可以使用retain_graph=True。

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

### PyTorch 中 `retain_graph` `create_graph` 参数的作用及用法 #### `retain_graph` 的作用 在 PyTorch 中,默认情况下,每次调用 `.backward()` 方法执行反向传播之后,计算图会被自动释放以节省内存。然而,在某些场景下,比如需要在同一计算图上进行多次反向传播时,则需通过设置 `retain_graph=True` 来阻止计算图的立即销毁。 例如: ```python a = torch.tensor(1., requires_grad=True) b = torch.tensor(1., requires_grad=True) c = a ** 2 d = b * c c.backward(retain_graph=True) # 第一次反向传播并保留计算图 d.backward() # 可再次利用相同的计算图进行第二次反向传播 ``` 上述代码展示了如何使用 `retain_graph=True` 实现多轮次的反向传播操作而无需重建计算图[^1]。 需要注意的是,如果频繁地设置此选项可能会引起 GPU 显存占用过高甚至溢出的问题,因此应当谨慎处理循环内的连续反向传播过程[^3]。 #### `create_graph` 的功能说明 另一方面,`create_graph` 主要应用于二阶及以上导数(即 Hessian 矩阵)的求解场合。当设定了 `create_graph=True` 后,不仅会构建当前层面对应的一阶导数链路结构,还会进一步追踪更高层次上的变化关系以便后续能够继续对其它变量求偏微分。 具体应用如下所示: ```python import torch def hessian_example(): x = torch.randn((), requires_grad=True) y = x ** 2 grad_y, = torch.autograd.grad( outputs=y, inputs=x, create_graph=True # 创建动态计算图支持高阶导数运算 ) hess_y, = torch.autograd.grad( outputs=grad_y, inputs=x # 对同一输入再做一次梯度计算得到Hessian矩阵中的元素 ) hessian_example() ``` 在此例子中,为了获取给定函数关于自变量 \(x\) 的海森矩阵项,必须先开启 `create_graph` 才能顺利完成整个流程[^4]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值