关于多任务中GradNorm的解读

GradNorm是一种用于深度多任务网络的技术,它通过归一化梯度的模长和使用初始Loss来适应性地平衡不同任务之间的损失,从而优化整体网络性能。
部署运行你感兴趣的模型镜像

GradNorm的思路实际上是用「梯度的模长」和「初始Loss」来做归一化,以下转载自: https://kexue.fm/archives/8870 和 GradNorm: Gradient Normalization for Adaptive Loss Balancing in Deep Multitask Networks
在这里插入图片描述

在这里插入图片描述

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

GPT-oss:20b

图文对话
Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型,面向强推理、智能体任务以及多样化开发场景

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值