在分类问题中CE loss 与BCE loss的应用

原创已于 2023-08-21 22:58:04 修改 · 2.2k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #机器学习 #深度学习 #算法

于 2022-04-18 08:18:59 首次发布

CV/NLP知识点专栏收录该内容

14 篇文章

订阅专栏

本文探讨了在视觉分类问题中，交叉熵（CE）和二元交叉熵（BCE）损失函数的区别和适用场景。CE通常用于多分类任务，而BCE适用于二分类或多标签分类。当类别间不互斥时，BCE结合sigmoid激活函数是合适的选择；若类别互斥，可以使用BCE处理多个二分类子问题或直接应用softmax和CE。对于多分类标签，one-hot编码通常用于多标签任务，而普通标签可能用于二分类或某些特定的多分类设置。损失函数的选择直接影响模型的训练效果和优化方向。

在做视觉分类问题的过程中有个问题一直困扰着我：
1.CE和BCE 分别是针对何种分类任务？
2.在做具体的任务时如何区别的使用他们？
3.分类标签对于不同的多分类任务，是选择普通标签还是one-hot标签？这和loss选择有关么？

损失函数公式定义区别

在这里插入图片描述

由于softmax输出的概率值和为1，网络的优化方向是提升对 y=1 的分类能力，自然其它类别的预测得分就会下降，因此不必担心假阳性的预测得不到改善。

类别间是否互斥问题

在分类问题中，如果遇到类别间不互斥的情况，只能采用“sigmoid+BCE”；

如果遇到类别间互斥的情况（只能有一类胜出），“sigmoid+BCE”化为多个二分类问题与“softmax+CE”直接进行分类都是有被用到的方法。

分类问题的loss使用

经过阅读文章发现，一般二分类多使用 BCE loss，无论是普通标签还是one-hot编码后的标签。

多分类问题又分为但标签多分类和多标签多分类，一般多标签多分类的标签是one-hot形式，使用CE loss。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。