pytorch：交叉熵（cross entropy）

最新推荐文章于 2025-03-14 18:09:14 发布

「已注销」

最新推荐文章于 2025-03-14 18:09:14 发布

阅读量8.2k

点赞数 4

文章标签： python pycharm 开发语言

本文链接：https://blog.youkuaiyun.com/weixin_62637793/article/details/121363832

版权

本文详细介绍了PyTorch中的交叉熵（cross entropy），包括熵（entropy）的概念，解释了熵的不确定性及与惊喜度的关系。接着讨论了交叉熵，指出其包含的KL散度用于衡量两个概率分布的相似度。当概率分布相同时，交叉熵等于熵。还分析了为何在神经网络中通常使用交叉熵而非MSE的原因，如避免sigmoid饱和和梯度弥散。最后，概述了Python中实现交叉熵损失的步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、entropy

entropy中文叫做熵，也叫不确定性，某种程度上也叫惊喜度（measure of surprise）

$Entropy=-\sum P(x)logP(x)$ = $\sum P(x)log(1/P(x))$

如果p（x）采用0-1分部，那么entropy=1log1=0

而对于entropy越大，即熵越大，越不稳定，惊喜度越高

例

import torch
a=torch.full([4],1/4.)
a*torch.log2(a)
# tensor([-0.5000, -0.5000, -0.5000, -0.5000])
-(a*torch.log2(a)).sum()
#输出  tensor(2.)

输出熵为2，不确定性较大惊喜度就比较高

import torch
a=torch.tensor([0.001,0.001,0.001,0.999])
-(a*torch.log2(a)).sum()
# 输出tensor(0.0313)

此时，输出熵为0.0313，比较小，不确定性小，惊喜度很低。

2、cross entropy</

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

「已注销」

关注关注

4
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

PyTorch中的交叉熵函数 CrossEntropyLoss的计算过程

人工智能

04-29

1436

关于CrossEntropyLoss() 函数的计算过程可以拆解为如下四个步骤：1、对输出的结果进行操作,因为操作可以将所有输入值都归为[0,1]之间，且所有值之和为1，符合概率分布的特性。2、对结果进行log运算，求出都是小于0的值3、对真实概率值进行编码4、利用下面的公式求出最终的loss值CrossEntropyLossx−i1∑nOneHottargeti∗logsoftmaxinputi。

交叉熵（Cross-Entropy）

最新发布

彬彬侠的博客

03-14

1114

torch.nn.functional.cross_entropy是PyTorch中用于分类任务的交叉熵损失函数，用于衡量预测概率分布与真实类别分布之间的差异，常用于多分类任务（multi-classclassification）。内部包含softmax+log+nll_loss，无需手动计算softmax。适用于多分类问题（input为logits，target为类别索引）。可以使用weight处理类别不均衡，使用ignore_index处理padding。在PyTorch分类任务中，推荐使用F.cros

pytorch中交叉熵

geter_CS的博客

04-08

1万+

关于pytorch中交叉熵的使用，pytorch的交叉熵是其loss function的一种且包含了softmax的过程。 pytorch中交叉熵函数是nn.CrossEntropyLoss()。其参数包括：weight，size_averaged，reduce weight参数通常默认值是0，如果你的训练样本很不均衡的话，可以设置其值。 size_averaged参数是设置是否取均值，默认...

Pytorch中的CrossEntropy

KK的博客

04-06

2749

Pytorch中的CrossEntropy表达式如何计算得到输出 Pytorch中的CrossEntropy 表达式 (1) 二分类在二分的情况下，模型最后需要预测的结果只有两种情况，对于每个类别我们的预测得到的概率为 p 和1-p 。此时表达式为：其中： yi —— 表示样本i的label，正类为1，负类为0 pi —— 表示样本i预测为正的概率 (2) 多分类多分类的情况实际上就是...

pytorch中的cross_entropy函数

Q_M_X_D_D_的博客

10-14

1万+

cross_entropy函数是pytorch中计算交叉熵的函数。输入主要包括两部分，一个是维度为（batch_size，class）的向量，class表示分类的数量，这个就表示模型预测的分类结果；另一个是维度为（batch_size）的一维矩阵，表示每个样本的真实分类。输出的就是交叉熵的值。 交叉熵 交叉熵是常见的损失函数，公式如下：其中y是真实分类，是通过softmax处理后的模型预测分类。在上面说了函数的输入分别是（batch_size，cl...

Pytorch：交叉熵损失(CrossEntropyLoss)以及标签平滑(LabelSmoothing)的实现

u013250861的博客

08-28

2083

一般情况下我们都是直接调用Pytorch自带的交叉熵损失函数计算loss，但涉及到魔改以及优化时，我们需要自己动手实现loss function，在这个过程中如果能对交叉熵损失的代码实现有一定的了解会帮助我们写出更优美的代码。其次是标签平滑这个trick通常简单有效，只需要改改损失函数既可带来性能上的提升，通常与交叉熵配合食用。因此，本文基于这两个出发点，介绍基于Pytorch框架下的交叉熵损失实现以及标签平滑的实现。.........

PyTorch: 交叉熵

2205_75881260的博客

03-07

370

当P=Q时，H(p,Q)=H(P)=-P(i)*log2[P(i)].sum()=Q时，H(P,Q)=-P(i)*log2[Q(i)].sum()#uncertainty越高，信息越多；entropy越高，信息越少。#分类问题使用交叉熵：cross entropy,而不使用mse。#Entropy=-P(i)*log2[P(i)]的求和。3. 交叉熵Cross Entropy。#二值分类：cat和dog。2. 熵Entropy。

pytorch中交叉熵损失(nn.CrossEntropyLoss())的计算过程详解

09-18

在PyTorch中，`nn.CrossEntropyLoss()` 是一个常用的操作，用于计算神经网络分类任务的损失。这个损失函数结合了对数 softmax 函数和负对数似然损失（negative log likelihood loss），常用于多分类问题。以下是 `nn...

【pytorch19】交叉熵

qq_45291280的博客

07-06

993

交叉熵

交叉熵的数学原理及应用——pytorch中的CrossEntropyLoss()函数

weixin_30691871的博客

12-25

2843

分类问题中，交叉熵函数是比较常用也是比较基础的损失函数，原来就是了解，但一直搞不懂他是怎么来的？为什么交叉熵能够表征真实样本标签和预测概率之间的差值？趁着这次学习把这些概念系统学习了一下。首先说起交叉熵，脑子里就会出现这个东西：随后我们脑子里可能还会出现Sigmoid()这个函数: pytorch中的CrossEntropyLoss()函数实际就是先...

CrossEntropy（交叉熵损失函数pytorch）

xiaziqiqi的博客

07-03

3652

weight，为一维张量，具体的大小为M，M为样本的标签数量，代表赋予的类别的权重ignore_index，int类型数据，用于指定忽略某个类别的索引。默认为 -100，表示不忽略任何类别。reduction：指定损失函数的计算方式。可选项包括：‘none’（不返回每个样本的损失值）、‘mean’（返回每个样本的平均损失值）、‘sum’（返回每个样本的总损失值）。N，代表了N个样本LiL_{i}Li，为某个样本的对应损失函数的值yiy_{i}yi。

必能读懂的 交叉熵详解，pytorch中交叉熵的使用

Defiler_Lee的博客

03-12

2635

目录 1. 交叉熵详解 1.1信息量 1.2 熵 1.3 相对熵（KL散度） 1.4交叉熵 1.5 小结 2. 交叉熵的应用（pytorch中） 2.1交叉熵在分类任务中的计算过程 2.2 log_softmax()函数 2.3nll_loss()函数 2.4cross_entropy()函数 2.5 函数的其他调用方式 1. 交叉熵详解 1.1...

pytorch之交叉熵（笔记四）

影子

05-08

391

师傅说过一句话：线性回归用二次代价函数，分类使用交叉熵。通过一个例子观察一下：通过观察发现，输入是0.82的比输入是0.98的收敛的更快，为什么呢？为我们通过sigmod函数观察一下。原因是在0.98的时候收敛的比较平缓，因为斜率比较小，0.82的时候斜率大，收敛的就比较快。 交叉熵的概念 交叉熵和二次代价函数对比。二次代价函数：代码请参考（我的博客pytorch之mnist手写数字识别（笔记三））：https://mp.youkuaiyun.com/editor/html/11..

Pytorch计算交叉熵

weixin_44777283的博客

04-29

161

【代码】Pytorch计算交叉熵。

Pytorch中的CrossEntropy函数

qq_43422995的博客

08-01

790

CrossEntropLoss

Pytorch常用的函数(十)交叉熵损失函数nn.BCELoss()、nn.BCELossWithLogits()、nn.CrossEntropyLoss()详解

qq_44665283的博客

05-13

3730

Pytorch常用的函数(九)交叉熵损失函数nn.BCELoss()、nn.BCELossWithLogits()、nn.CrossEntropyLoss()详解

pytorch基础知识-Cross Entropy

gdufsTFknight的博客

07-17

563

pytorch基础知识-Cross Entropy https://cloud.tencent.com/developer/article/1539723 上节课介绍了Cross Entropy 与 Enropy的区别，本节介绍Cross Entropy到底在二分类问题中是如何运算的。假设面对的是猫狗的二分类问题，此时的Cross Entropy的表示公式为：为更好的理解，我们以5分类问题进行解释实际值为小猫。当模型预测效果较好时这里注意到使用Cross En...

pytorch nn.crossentropyloss()

06-06

pytorch nn.crossentropyloss() 是一个在神经网络中常用的交叉熵损失函数。它是用来计算分类问题中的损失值的。其计算公式为：L=-ylog(p)-(1-y)log(1-p)，其中y是真实标签值，p是预测标签的概率。nn.crossentropy...