center loss 论文学习

最新推荐文章于 2025-01-09 19:57:09 发布

Yan_Joy

最新推荐文章于 2025-01-09 19:57:09 发布

阅读量2.1k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： tensorflow 机器学习文章标签：框架网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Yan_Joy/article/details/79104993

机器学习同时被 2 个专栏收录

27 篇文章

订阅专栏

14 篇文章

订阅专栏

本文深入解析了CenterLoss的工作原理及其在深度学习中的应用。通过对比传统网络框架，详细介绍了CenterLoss如何使同一类别的输出结果更加集中，从而提高分类准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

center loss框架

从网络的的框架来看，center loss的主要工作是下图中的“Discriminative Features”。
fig1

普通的网络框架，在反向传播的过程中，根据类别标签，会将不同的类别划分开。如“Separable Features”所示，一开始两种颜色是混杂的，通过改变网络参数，让不同颜色能被分类器分开，就达到了目的。而这个过程中，只对不同类有要求，同一类没有进行约束。
center loss则是让类内的输出结果更加集中。

为了展示实际的效果，作者在mnist上进行了测试，下图是softmax分类器前面增加的一层的参数，其维度为2，这样就可以进行可视化的显示。

F = W X

$F=WX$

$X$ 是上一层的输出，维度为800（根据论文计算得到）， $F$ 为施加center loss的全连接层的输出，维度为2。那么权重参数 $F$ 为{800,2}的矩阵。
fig2
在没有采用center loss时，不同类别的输出图像是一种花瓣，其特点是同一类的方差较大。可以找到分界线将不同类别区分开，虽然花瓣外尖端与其他类间距很大，花瓣中心的区分很小，很容易造成错误，如橘色区域，红线表示分类线。
这里写图片描述

如何让同一类颜色更集中呢？文中采用了center loss：
centerloss
很简单，每个将输出点与这类中心点的距离累加作为损失。
回想方差公式：

是不是很类似？降低center loss其实也可以看作是降低同类的方差。

实现

推荐EncodeTS/TensorFlow_Center_Loss的代码，使用TensorFlow实现，且有详细的中文注释。

center loss流程大致为：

初始化权重中心centers，形状为[num_classes, len_features]，中心值为0
在一次iteration中，获取mini-batch中每一个样本对应的中心值，centers_batch，形状为[batch_size, feature_length]（使用tf.gather技巧）
计算loss，特征与中心features - centers_batch的l2范数
根据论文公式（3）（4）更新权重中心：
在一个mini-batch中，某一类j出现了n次，分解来看：
1. 属于该类的第i个样本与中心距离cj−xi
  - 同理算出这个类出现的 $n$ 次样本的距离，并汇总求和
  - 除以 $n+1$

博客等级

码龄9年

57
原创

95
点赞

186
收藏

117
粉丝

关注

私信

热门文章

分类专栏

caffe 21篇
proto 5篇
python 20篇
机器学习 27篇
yolo 1篇
linux 3篇
tensorflow 14篇
maskrcnn 1篇
cuda 5篇
caffe2 3篇
blog 2篇
pandas 1篇
keras 3篇
pytorch 5篇

展开全部收起

上一篇：: DeepCompression思考

下一篇：: python list 复制拷贝问题

最新评论

Distiller:神经网络压缩研究框架
初学者chris: Python 3.5不行，因为文件有Python f 字符串的使用，只有3.6开始才能编译，忘改正
MMdnn：微软模型转换工具
DashingPig: 有帮助，感谢
tf.cond 与 tf.control_dependencies 的控制问题
asdfmnbvdslkjfs: 所以和tf.control_dependencies与否没有关系？
tf的条件赋值（量化）
图灵和柯南道尔的大弟子: 经过验证发现sess.run( (a>0) & (a<5))这种方式是可以有输出结果的，但是输出结果是不正确的，而使用sess.run( (a>0) and (a<5))同样也会报错，不明白计算结果错误以及报错的原因。
tf的条件赋值（量化）
图灵和柯南道尔的大弟子: 还有就是这种方式会存在bug，主要是由tf.logical_and这个函数本身的bug引起的。比如说a = [-3, 4, 5, -6, -8, -2], tf.logical_and(a>0,a<5)的结果是[False, True, True, False, False, False]，其中的5实际上应该对应的是False但是计算结果却是True。a>0对应[False, True, True, False, False, False]， a<5对应[ True, True, False, True, True, True]，tf.logical_and([False, True, True, False, False, False]，[ True, True, False, True, True, True]）结果是[False, True, False, False, False, False】，反而是正确的。有没有知道为什么的大佬解答一下啊？

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。