pytorch网络梯度为0

在进行深度学习模型训练时,遇到梯度回传为0的问题,经过排查发现是由于使用torch.round()函数对张量进行操作,该函数返回新张量,导致梯度无法正确传播。此问题提醒我们在代码中要注意这类不连续的数学操作可能对反向传播的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

自己的代码遇到了梯度回传为0的问题,检查了很久,最后发现是torch.round()对张量操作之后导致梯度断裂,因为round是返回的一个新的张量,之前没有注意到,记录一下。

函数详解:

torch.round(input, out=None)

说明:返回一个新张量,将输入input张量的每个元素舍入到最近的整数。

参数:

  • input(Tensor):输入张量

  • out(Tensor,可选):输出张量

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值