pytorch | 计算图像的一阶导/梯度/gradient

最新推荐文章于 2025-10-25 10:29:05 发布

原创

最新推荐文章于 2025-10-25 10:29:05 发布 · 1.6w 阅读

19 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #计算机视觉 #图像处理

本文介绍了在PyTorch中计算图像的一阶导数和梯度，特别是在图像转换任务中的应用，如total variation loss。通过参考numpy源码并使用torch.nn.functional.pad()函数，作者实现了一个计算图像一阶导数的方法。然而，在尝试将图像的梯度作为损失函数进行反向传播时，遇到了梯度爆炸的问题，即使调整loss权重和学习率也无法避免。

[pytorch] 计算图像的一阶导 / 梯度 / gradient

在图像转换任务中常见的total variation loss（tvloss，总变分，一般作为平滑的规则化项）需要对图像的梯度求平方和。
style-transfer系的github项目，tvloss求法如下：

class TVLoss(torch.nn.Module):
    def __init__(self):
        super(TVLoss,self).__init__()

    def forward(self,x):
        h_x = x.size()[2]
        w_x = x.size()[3]
        count_h = self._tensor_size(x[:,:,1:,:])
        count_w = self._tensor_size(x[:,:,:,1:])
        h_tv = torch.pow((x[:,:,1:,:]-x[:,:,:h_x-1,:]),2).sum()
        w_tv = torch.pow((x[:,:,:,1:]-x[:,:,:,:w_x-1

最低0.47元/天解锁文章

6 条评论

Timer-419 2020.04.26
博主可以尝试一下，tensor.detach() 返回一个新的tensor，从当前计算图中分离下来的，但是仍指向原变量的存放位置,不同之处只是requires_grad为false，得到的这个tensor永远不需要计算其梯度，不具有grad。即使之后重新将它的requires_grad置为true,它也不会具有梯度grad 这样我们就会继续使用这个新的tensor进行计算，后面当我们进行反向传播时，到该调用detach()的tensor就会停止，不能再继续向前传播。

qq_35366466 2020.01.10
那最后楼主弄明白了吗？梯度先验不可以加在loss函数吗？？

木瓜子 2019.04.03
博主可以提供一下一个TVloss的GitHub链接吗

JAYK24 2018.12.27
我用你写的Loss，图片输出是梯度图，也是梯度爆炸，可能实现上有问题，我用Conv2D实现的[code=python] class ST_loss(nn.Module): def __init__(self, Lambda=0.3): super(ST_loss, self).__init__() self.conv_x = nn.Conv2d(1, 1, kernel_size=3, stride=1, padding=1) self.conv_y = nn.Conv2d(1, 1, kernel_size=3, stride=1, padding=1) conv_x = np.array([[-1.0,0,1], [-2,0,2], [-1,0,1]]) conv_y = np.array([[-1.0,-2,-1], [0,0,0], [1,2,1]]) self.conv_x.weight = nn.Parameter(torch.from_numpy(conv_x).float().unsqueeze(0).unsqueeze(0)) self.conv_y.weight = nn.Parameter(torch.from_numpy(conv_y).float().unsqueeze(0).unsqueeze(0)) self.Lambda = Lambda def getGrd(self, input): grd_x = self.conv_x(input) grd_y = self.conv_y(input) out = torch.sqrt(grd_x**2 + grd_y**2) / 2 h, w = out.shape[2], out.shape[3] out[:, :, [0, h-1], :] = 0 out[:, :, :, [0, w-1]] = 0 return out [/code]
- imagenoob回复densechen 2020.11.05
  self.weight_x = nn.Parameter(data = kernel_x, requires_grad = False)
- densechen回复JAYK24 2019.03.29
  [reply]JAYK24[/reply] 你不能使用这种方式进行卷积操作。这种方式下，反向传播会更新conv_x,conv_y的权重