Cross Entropy Loss(交叉熵)快速理解

本文探讨了神经网络中损失函数的角色,详细介绍了回归问题的均方误差与平均绝对值误差,以及分类问题中的交叉熵损失函数。通过softmax转换,交叉熵能有效衡量预测概率与真实标签间的距离,推动模型优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

监督学习分为两大类:分类问题和回归问题。简单来说,分类问题目标输出的是离散值,回归问题目标输出的是连续值。但是无论是哪种问题,神经网络模型的效果及优化的目标都是通过损失函数来定义的。

对于回归问题常用的损失函数有:均方误差(MSE),平均绝对值误差(也称L1损失)等。

对于分类问题,常用的损失函数则为交叉熵(Cross Entropy Loss)。

我们知道,在神经网络中,softmax()会将神经网络的原始输出值(就是input经过一系列复杂的加权和非线性处理后的值)转化为一个概率值。而交叉熵本质上描述的是两个概率分布的距离,即实际概率与期望概率之间的距离。这就不难理解:交叉熵的值越小,两个概率分布就越接近,也就是预测值越接近期望值。机器学习正是通过这种训练使得每一个样本的交叉熵值越小越好,达到更好的预测效果的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值