Loss Balancing

本文探讨了在复现Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics研究时遇到的问题。在PyTorch实现中,作者强调了两个关键点:1. 处理权重参数sigma时应将其视为可学习的parameter,而非常数;2. 在计算损失加权的总损失L时,权重W需要在计算图中,因此应将其置于forward函数内,以确保梯度正确计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

为复现: Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics

(https://arxiv.org/pdf/1705.07115.pdf)

文章中:

原文章定义sigma为噪声,在原论文复现中(https://github.com/yaringal/multi-task-learning-example/blob/master/multi-task-learning-example.ipynb)直接是可学习的参数,见下图:

用pytorch复现的坑:

1、要用parameter,而不是定义常数torch.Tensor(torch.zeros(1))

from torch.nn import Parameter
    self.log_cate    =  Parameter(torch.Tensor(1))
    self.log_regress = Parameter(t
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值