[论文] pcgrad

本文探讨了多任务学习中梯度冲突的问题,提出PCGrad方法通过将任务梯度投影到正交平面消除冲突。PCGrad针对高曲率和梯度差异大时,减少任务间干扰,适用于监督和强化学习。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#在这里插入图片描述

Introduction

多任务学习中,有时会遇到两个任务的梯度方向冲突的问题。我们将梯度冲突定义为,夹角cosine < 0. 梯度冲突是有害的 when a) conflicting gradients coincide with b) high
positive curvature and c) a large difference in gradient magnitudes.

  1. 高曲率:高曲率的地方 性能提升会被高估
  2. 两个梯度的数值差异极大(有一个主导梯度)

例子:
在这里插入图片描述
本文中提出的 PCGrad 方法应对了这个问题。当多个任务的梯度在更新时相互冲突时,PCGrad 主要考虑如何修整这些梯度,使它们不再互相矛盾。具体地,它通过将每个任务的梯度投影到与其他任务梯度冲突方向的正交平面上,来消除梯度之间的冲突。

三重tragic的定义:梯度冲突、主导梯度、高曲率

在这里插入图片描述
定义1:夹角cos<0即为冲突
定义2:如果梯度值的相似度高,则值为1,否则趋近于0
定义3:多任务梯度∇L(θ)\nabla \mathcal{L}(\theta)L(θ)的方向上,L\mathcal{L}Lθ\thetaθθ′\theta^{\prime}θ之间的平均曲率

PCGrad: Project Conflicting Gradients

在这里插入图片描述
如果两个任务之间的梯度发生冲突,即它们的余弦相似度为负,则我们将每个任务的梯度投影到另一个任务的梯度的法向平面上。这相当于为任务去除了梯度的冲突组件,从而减少了任务之间的梯度干扰。这个想法的图解如图2所示。

效果

监督学习

在这里插入图片描述
在这里插入图片描述

强化学习

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值