交叉熵损失函数整理

最新推荐文章于 2025-03-22 22:01:38 发布

66Kevin

最新推荐文章于 2025-03-22 22:01:38 发布

阅读量4.6k

点赞数 1

分类专栏：机器学习文章标签：交叉熵机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_44551646/article/details/107587245

版权

本文深入探讨了交叉熵函数的推导与直观理解，对比了Sigmoid+Cross-entropy与SoftMax+Cross-entropy的不同形式，解析了交叉熵在多分类问题中的应用，并讨论了其优缺点。此外，还解释了为何逻辑回归中使用交叉熵而非均方误差。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

一.交叉熵函数的由来(推导)
- 1.1普通推导交叉熵：
- 1.2极大似然推导交叉熵：
二.交叉熵函数直观理解
三.交叉熵的两种不同形式
- 3.1 Sigmoid + Cross-entropy
- 3.2 SoftMax + Cross-entropy
四.交叉熵函数求导
- 4.1 Sigmoid + Cross-entropy
- 4.2 SoftMax + Cross-entropy
六.优缺点
七.为什么逻辑回归不用MSE而用交叉熵

一.交叉熵函数的由来(推导)

1.1普通推导交叉熵：

我们一共有m组已知样本, $x^{(i)},y^{(i)})$ 表示第i组数据及其对应的类别标记,
其中 $x^{(i)} = (1, x^{i}_1,x^{i}_2,x^{i}_3…x^{i}_p)$ , $y^{(i)}$ 则为表示类别的一个数：

logistic回归（二分类问题）中， $y (i)$ 取0或者1；
softmax回归（多分类问题）中， $y (i)$ 取1,2…k中的一个表示类别标号的一个数（假设共有k类)

以上来自交叉熵代价函数(损失函数)及其求导推导 (Logistic Regression)

1.2极大似然推导交叉熵：

在这里插入图片描述

二.交叉熵函数直观理解

单个样本的交叉熵损失函数（注意这里是用单个样本做例子,因此公式里没有 $\Sigma$ ）：
$L o s s = - [y l o g \overset{y}{^} + (1 - y) l o g (1$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。