Pytorch：Variable detach

最新推荐文章于 2025-06-14 09:00:00 发布

LemonTree_Summer

最新推荐文章于 2025-06-14 09:00:00 发布

阅读量412

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch

本文链接：https://blog.youkuaiyun.com/LemonTree_Summer/article/details/80829917

PyTorch 专栏收录该内容

25 篇文章

订阅专栏

本文介绍在PyTorch中使用detach()和detach_()方法来阻止梯度传播的具体应用场景，包括如何在不希望某些变量参与反向传播时进行操作，以及这两种方法在实际项目中的优缺点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

举个栗子：

有两个网络F和G，其中y=F(x), z=G(y), 假设现在想通过z.bachward()实现z对y的求导，但是又不想y对x求导

那么怎么做呢？

# 第一种
y=F(x)
z=G(y.detach())
z.backward()

# 第二种
y=F(x)
y_ = y.detach_()
z=G(y_)
z.backward()

detach():返回一个新的从当前图中分离的Variable，且返回的Variable永远不会需要梯度，返回的Variable和被detach的Variable指向同一个tensor

detach_():把Variable作为叶子结点，从创建它的图中剥离出来

上面的栗子用两种方法都可以，但是如果y也想对F网络进行BP呢？就只能用第一种方法了，因为第二种已经把网络的输出y当作叶子结点从模型中detach(分离)出去了(˶‾᷄ ⁻̫ ‾᷅˵)

总之，用第一种总没错啦(>^ω^<)就目前的水平来看～

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LemonTree_Summer

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

PyTorch 入门实战（二）——Variable

黄笳倞的博客

01-15

1万+

1.Variable和Tensor本质上没有区别，不过Variable会被放入一个计算图中，然后进行前向传播，反向传播，自动求导。2.Variable有三个属性，可以通过构造函数结构求取梯度得到grad值和grad_fn值3.Variable，Tensor和Numpy互相转化很方便，类型也比较兼容。

pytorch的函数 .detach()

群星闪耀的博客

06-16

1万+

参考： http://www.bnikolic.co.uk/blog/pytorch-detach.html

参与评论您还未登录，请先登录后发表或查看评论

【Python】torch中的.detach（）函数详解和示例

不定时分享，互相学习，共同进步

01-16

6421

在PyTorch中，.detach()是一个用于张量的方法，主要用于创建该张量的一个“离断”版本。这个方法在很多情况下都非常有用，例如在缓存释放、模型评估和简化计算图等场景中。

pytorch: Variable detach 与 detach_

Keith

08-05

3万+

pytorch 的 Variable 对象中有两个方法，detach和 detach_ 本文主要介绍这两个方法的效果和能用这两个方法干什么。 detach 官方文档中，对这个方法是这么介绍的。返回一个新的从当前图中分离的 Variable。返回的 Variable 永远不会需要梯度如果被 detach 的Variable volatile=True，那么 detach 出来...

Pytorch中的clone和detach方法介绍

热门推荐

weixin_33913332的博客

04-09

4万+

参考：https://pytorch-cn.readthedocs.io/zh/latest/package_references/torch-autograd/#detachsource 当我们再训练网络的时候可能希望保持一部分的网络参数不变，只对其中一部分的参数进行调整；或者值训练部分分支网络，并不让其梯度对主网络的梯度造成影响，这时候我们就需要使用detach()函数来切断一些分支的反向传...

【深度学习】Pytorch中.detach()函数

wzk4869的博客

10-02

1645

【深度学习】Pytorch中.detach()函数

pytorch.detach分离函数

scar2016的博客

11-20

2083

文章目录1.官方定义detach2. 解释3. 代码4. 结果5. 小结 1.官方定义detach 官方解释 Returns a new Tensor, detached from the current graph. The result will never require gradient. 返回一个与当前图分离的新张量。结果永远不需要梯度。 2. 解释举例说明，假设我们有一个函数 y = x * x ,我们想重新有一个变量 u = y.detach(),此时 u 和 y 同值，我们再定义另外一个

pytorch中深度拷贝_pytorch：对比clone、detach以及copy_等张量复制操作

weixin_39901404的博客

12-19

3521

pytorch提供了clone、detach、copy_和new_tensor等多种张量的复制操作，尤其前两者在深度学习的网络架构中经常被使用，本文旨在对比这些操作的差别。1. clone返回一个和源张量同shape、dtype和device的张量，与源张量不共享数据内存，但提供梯度的回溯。下面，通过例子来详细说明：示例：(1)定义import torcha = torch.tensor(1.0,...

Pytorch中的detach用法

CoolCoolCarrot的博客

02-16

2734

该方法主要应用在Variable变量上，作用是从分离出一个tensor，值和原Variable一样，但是不需要计算梯度。其源码如下： def detach(self): result = NoGrad()(self) # this is needed, because it merges version counters result._grad_fn = None ...

【PyCharm与PyTorch：从零开始的完美结合指南】

![【PyCharm与PyTorch：从零开始的完美结合指南】]... PyCharm与PyTorch介绍 ## 1.1 PyCharm的优势与定位 PyCharm是由JetBrains公司开发的一款功

Pytorch:GAN生成对抗网络实现MNIST手写数字的生成

lwf1881的博客

11-15

2865

github：https://github.com/SPECTRELWF/pytorch-GAN-study 个人主页：liuweifeng.top:8090 网络结构最近在疯狂补深度学习一些基本架构的基础，看了一下大佬的GAN的原始论文，说实话一头雾水，不是能看的很懂。推荐B站李宏毅老师的机器学习2021的课程，听完以后明白多了。原始论文中就说了一个generator和一个discriminator的结构，并没有细节的说具体是怎么去定义的，对新手不太友好，参考了Github的Pytorch-Gan-ma

pytorch .detach() .detach_() 和 .data用于切断反向传播的实现

09-18

主要介绍了pytorch .detach() .detach_() 和 .data用于切断反向传播的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

pytorch中Variable detach 与 detach_

qq_36201400的博客

09-24

296

detach 官方文档中，对这个方法是这么介绍的。返回一个新的从当前图中分离的 Variable 返回的 Variable 永远不会需要梯度如果被 detach 的Variable volatile=True，那么 detach 出来的 volatile 也为 True 还有一个注意事项，即：返回的 Variable 和被 detach 的Variable 指向同一个 tensor import torch from torch.nn import init from torch.a

关于Pytorch中detach

qq_34418352的博客

05-31

3982

1 首先没有detach的情况定义了一系列操作，如下，中间结点y1和y2没有梯度。没有采取detach。 import torch w1 = torch.tensor([2.], requires_grad=True) # print(w1.type()) # torch.FloatTensor w2 = torch.tensor([4.], requires_grad=True) w3 = torch.tensor([6.], requires_grad=True) w4 = torch.te

PyTorch中detach() 函数详解

阿正的梦工坊

12-13

2146

detach() 是 PyTorch 中非常重要的一个工具，主要用于从计算图中分离张量，从而防止梯度传播、提高内存效率或保存中间结果。

PyTorch detach()：深入解析与实战应用

创作高质量博文，分享知识，共同进步！

02-13

1万+

【🚀PyTorch detach()探秘🚀】🌟解锁PyTorch深度学习框架中的神秘函数detach()！📚本文将带您深入了解detach()的工作原理，以及其在实战中的应用场景！💪掌握detach()，让您的模型训练更加灵活高效，轻松征服复杂的数据科学挑战！🌈

pytorch detach()

xiongzai2016的博客

07-07

1179

detach(）的主要用途是将有梯度的变量变成没有梯度的，即requires grad=True变成requires grad=False. 因为网络内的值或输出的值都有梯度，所以要想将值转换成其他类型，都需要先去掉梯度.如转换成numpy类型，一般这样搭配使用：.detach().cpu().numpy()或.detach().numpy(),其中第一个是将GPU类型变成CPU类型，再继续转换成numpy类型，第二种是CPU类型转换成numpy()类型，如果你的电脑是用GPU训练就用第一种，用CPU训练就

PyTorch 中的 detach 函数详解

阿正的梦工坊

12-13

1630

detach返回的新张量与原张量共享相同的底层数据。这意味着修改新张量的值会影响原张量的值

PyTorch重大更新：Tensor与Variable融合及核心改进

这个标志原本用于控制计算图的记录，但在新的版本中，更推荐使用`.detach()`或`.requires_grad_(False)`来实现类似的功能，这将使代码更加清晰且易于理解。在改进方面，PyTorch增加了对数据类型的dtypes和设备系统...