Circle Loss: A Unified Perspective of Pair Similarity Optimization简要阅读笔记

本文深入探讨了Circle Loss在分类任务中的应用,指出传统损失函数在优化灵活性和收敛状态清晰度上的不足。Circle Loss通过引入不同惩罚系数,解决了类内距离和类间距离优化不平衡的问题,提升了特征空间的可分离性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.背景

常见的分类损失函数可以概括为减小类内距离sns_nsn,增大类间距离sps_psp。优化目标如下:
min(sn−sp) min(s_n-s_p)min(snsp)

2.存在的问题

  • 优化不够灵活。
    优化目标对sns_nsnsps_psp的惩罚作用是相等的,二者的系数都为1。
    例如{sn,sp}={0.1,0.5}\{s_n,s_p\}=\{0.1 ,0.5 \}{sn,sp}={0.1,0.5}。这个时候类内距离sn=0.1s_n=0.1sn=0.1,接近0,模型已经能够很好的将相同的类聚在一起。但由于此时sp=0.5s_p=0.5sp=0.5,受sps_psp的牵累,sns_nsn依然会接受一个较大的惩罚梯度。
  • 收敛状态模糊。
    margin=sn−spmargin = s_n-s_pmargin=snsp
    考虑两个状态。T={sn,sp}={0.2,0.5}T=\{s_n,s_p\}=\{0.2,0.5 \}T={sn,sp}={0.2,0.5},T1={0.4,0.7}T^1=\{0.4,0.7\}T1={0.4,0.7}虽然TTTT1T^1T1收敛状态是一样的,marginmarginmargin都是0.3,但此时0.5和0.4已经十分接近,即TTT时候的类间距离和T1T^1T1时候的类内距离是差不多的,这种收敛状态会破坏特征空间的可分离性(不同类间的边界相互耦合,不够清晰)。

3.动机

针对上述两个challenge,给sns_nsnsps_psp加上不同的惩罚系数,优化目标变为:
min(α∗sn−β∗sp)min(α*s_n - β*s_p)min(αsnβsp)

ps:决策边界从常见方法的直线变为本文方法的环形,故取名为circle loss。
在这里插入图片描述

4.个人感受

额外引入了两个超参,性能一般,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值