Circle Loss: A Unified Perspective of Pair Similarity Optimization简要阅读笔记

dailleson_

于 2020-09-01 11:39:54 发布

阅读量1k

点赞数 7

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习数据挖掘神经网络深度学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Dailleson/article/details/108336818

机器学习专栏收录该内容

2 篇文章

订阅专栏

本文深入探讨了Circle Loss在分类任务中的应用，指出传统损失函数在优化灵活性和收敛状态清晰度上的不足。Circle Loss通过引入不同惩罚系数，解决了类内距离和类间距离优化不平衡的问题，提升了特征空间的可分离性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.背景

常见的分类损失函数可以概括为减小类内距离 $s_n$ ，增大类间距离 $s_p$ 。优化目标如下：
$min(s_n-s_p)$

2.存在的问题

优化不够灵活。
优化目标对 $s_n$ 和 $s_p$ 的惩罚作用是相等的，二者的系数都为1。
例如 ${s_n,s_p\}=\{0.1 ,0.5 \}$ 。这个时候类内距离 $s_n=0.1$ ，接近0，模型已经能够很好的将相同的类聚在一起。但由于此时 $s_p=0.5$ ，受 $s_p$ 的牵累， $s_n$ 依然会接受一个较大的惩罚梯度。
收敛状态模糊。
记 $margin = s_n-s_p$
考虑两个状态。 $T=\{s_n,s_p\}=\{0.2,0.5 \}$ , $T^1=\{0.4,0.7\}$ 虽然 $T$ 和 $T^1$ 收敛状态是一样的， $m a r g i n$ 都是0.3，但此时0.5和0.4已经十分接近，即 $T$ 时候的类间距离和 $T^1$ 时候的类内距离是差不多的，这种收敛状态会破坏特征空间的可分离性（不同类间的边界相互耦合，不够清晰）。

3.动机

针对上述两个challenge，给 $s_n$ 和 $s_p$ 加上不同的惩罚系数，优化目标变为：
$min(α*s_n - β*s_p)$

ps:决策边界从常见方法的直线变为本文方法的环形，故取名为circle loss。
在这里插入图片描述

4.个人感受

额外引入了两个超参，性能一般，

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。