torch.nn里的损失函数：MSE、BCE、BCEWithLogits、NLLLoss、CrossEntropyLoss的用法

最新推荐文章于 2025-03-21 15:15:50 发布

zcm0126

最新推荐文章于 2025-03-21 15:15:50 发布

阅读量8.3k

点赞数 15

文章标签：深度学习 pytorch

本文链接：https://blog.youkuaiyun.com/zcm0126/article/details/106302360

版权

1. nn.MSELoss()

模型的预测值与标签的L2距离。一般用于回归问题。之所以不用于分类问题，可能原因为：使用sigmoid之后，函数形式不是凸函数，不容易求解，容易进入局部最优。

loss = nn.MSELoss()
input = torch.randn(3, 5, requires_grad=True)
target = torch.randn(3, 5)
output = loss(input, target)
output.backward()

2. nn.BCELoss()

交叉熵损失函数，衡量两个分布之间的差异，一般用于分类问题。输入的x值需先经过sigmoid压缩到（0,1）之间。标签形式为[0, 0, 1], [0, 1, 1]等，各个类别预测概率独立，类与类之间不互斥，可见不仅能用于二分类问题，也能用于多标签分类问题。

m = nn.Sigmoid()
loss = nn.BCELoss()
input = torch.randn(3, requires_grad=True)
target = torch.empty(3).random_(2)
output = loss(m(input), target)
output.backward()

3. nn.BCEWithLogitsLoss()

交叉熵损失函数，与nn.BCELoss()不同的是网络的输出无需用sigmoid压缩，函数内部整合了nn.sigmoid()和nn.BCELoss(),并且使用log-sum-exp trick提高了数值稳定性。同样可用于二分类及多标签分类。
这里简单介绍一下log-sum-exp trick：
原始的log-sum-exp公式为：

$log\sum_{i}^{}e^{x_{i}}$
在 $x_{i}$

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zcm0126

关注关注

15
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

深度学习loss总结：nn.CrossEntropyLoss,nn.MSELoss,Focal_Loss,nn.KLDivLoss等

@bangbang的博客

11-19

949

交叉熵主要是用来判定实际的输出与期望的输出的接近程度，也就是交叉熵的值越小，两个概率分布就越接近。假设概率分布p为期望输出(target)，概率分布q为实际输出(pred),HpqH(p,q)HpqPytorch中的CrossEntropyLoss()函数而是交叉熵的另外一种方式计算得到的：Pytorch中函数的主要是将和NLLLoss最小化负对数似然函数）合并到一块得到的结果(1)首先对预测值pred进行softmax计算：其中softmax。

Pytorch 之torch.nn进阶第2关：损失函数

admin的博客

10-05

1128

衡量输入 x和目标 y之间样本方差的平均绝对值：

参与评论您还未登录，请先登录后发表或查看评论

[Python] pytorch损失函数之MSELoss(均方误差损失)介绍和使用场景

老狼工作室的博客

01-05

1万+

pytorch损失函数之MSELoss(均方误差损失)介绍和使用场景

Pytorch中torch.nn的损失函数

12-21

目录前言一、torch.nn.BCELoss(weight=None, size_average=True) 二、nn.BCEWithLogitsLoss(weight=None, size_average=True) 三、torch.nn.MultiLabelSoftMarginLoss(weight=None, size_average=True) 四、总结前言最近使用Pytorch做多标签分类任务，遇到了一些损失函数的问题，因为经常会忘记（好记性不如烂笔头囧rz），都是现学现用，所以自己写了一些代码探究一下，并在此记录，如果以后还遇到其他损失函数，继续在此补充。如果有兴趣，我建

均方误差损失函数（Mean Squared Error, MSE）详解

最新发布

cnb_120509的博客

03-21

225

均方误差损失函数（MSE）是回归任务中最常用的损失函数之一，用于衡量模型预测值与真实值之间的平均平方误差。以下是其公式分解、数学推导及实际应用中的关键细节。

nn.损失函数

weixin_44741829的博客

11-24

2596

nn.L1Loss https://pytorch.org/docs/stable/generated/torch.nn.L1Loss.html#torch.nn.L1Loss 例子： input=[1,3,4] target=[2,3,7] 则loss=（|2-1|+|3-3|+|7-4|)/3=4/3=1.333 import torch from torch import nn input = torch.tensor([1, 3, 4],dtype=torch.float) target = to

torch.nn中常用的损失函数

weixin_35749796的博客

01-02

1038

在 torch.nn 中常用的损失函数有: nn.MSELoss: 均方误差损失函数, 常用于回归问题. nn.CrossEntropyLoss: 交叉熵损失函数, 常用于分类问题. nn.NLLLoss: 对数似然损失函数, 常用于自然语言处理中的序列标注问题. nn.L1Loss: L1 范数损失函数, 常用于稀疏性正则化. nn.BCELoss: 二分类交叉熵损失函数, 常用于二分类问题....

torch.nn中有哪些损失函数？

万物琴弦存于你的泡沫之中，光锥之外

10-30

1万+

torch.nn

pytorch系列 --11 pytorch loss function： MSELoss BCELoss CrossEntropyLoss及one_hot 格式求 cross_entropy

墨流觞的博客

11-13

8540

本文主要包括： pytorch 实现的损失函数 pytorch实现的loss function 神经网络主要实现分类以及回归预测两类问题，对于回归问题，主要讲述均方损失函数，而对于一些回归问题，需要根据特殊情况自定义损失函数。对于分类，主要讲述二分类交叉熵和多分类交叉熵函数在讲解函数之前，提前说一下：所有的loss的基类是Module，所以使用loss的方法是： # 1. 创建损失函数...

torch.nn.functional函数和torch.nn.Module层比较

qq_27390023的博客

10-23

2321

提供了更方便的接口，适合常规的神经网络层，自动管理参数并简化模型的构建。提供了更底层、更灵活的操作，适合在需要完全控制参数和操作的情况下使用。

聊聊关于分类和分割的损失函数：nn.CrossEntropyLoss()

Henry的博客

03-10

4555

解释分类和分割中，CrossEntropyLoss 交叉熵损失函数的作用

两种常用损失函数：nn.CrossEntropyLoss 与 nn.TripletMarginLoss

大多_C的博客

09-08

653

适用于分类任务，用于衡量模型输出的类别分布与真实标签之间的差距。适用于对比学习，通过比较锚点、正样本和负样本的嵌入向量，确保正样本更接近锚点，负样本远离锚点。在这个训练流程中，两者结合使用，以同时优化分类任务和对比学习任务中的关系表示。

PyTorch nn.CrossEntropyLoss() 交叉熵损失函数详解和要点提醒

热门推荐

Hoper-J的博客

06-22

2万+

PyTorch nn.CrossEntropyLoss() 交叉熵损失函数详解和要点提醒

torch.nn损失函数总结

yf416的博客

10-16

1125

loss

神经网络 torch.nn---损失函数与反向传播

用来自己学习，复习

06-06

1136

即我们可以以target为依据，不断训练神经网络，优化神经网络中各个模块，从而优化output。2、−x[class]：在已知图片类别的情况下，预测出来对应该类别的概率x[class]越高，其预测结果误差越小。输出结果为[0.1,0.2,0.3]，该列表中的数字分别代表分类标签对应的概率。，每个结果概率都很高，这显然是不合理的。当我们进行反向传播的时候，对每一个节点的参数都会求出一个对应的。个元素对应的差值的绝对值求和，得出来的结果除以。的图片进行分类，其标签的索引分别为。的概率更大，即0.3。

神经网络入门实战：（十五）损失函数的介绍与使用

qq_51409113的博客

12-05

1384

神经网络入门实战中的损失函数的介绍与使用

torch.nn 的损失函数

03-16

<think>好的，用户想知道PyTorch中torch.nn模块里的损失函数列表以及使用方法。首先，我需要回忆一下常见的损失函数有哪些，比如MSELoss、CrossEntropyLoss这些。然后要确定每个损失函数的用途、输入输出格式和注意事项。首先，我应该列出主要的损失函数，每个函数单独说明。比如MSELoss用于回归任务，计算均方误差。输入通常是模型输出和目标值，要保持形状一致。然后CrossEntropyLoss用于分类，特别是多类分类，这里要注意输入是否已经过softmax处理，PyTorch的这个函数内部已经包含了softmax，所以不需要额外处理。接下来是BCELoss，二分类交叉熵，这时候要强调输入需要经过sigmoid激活，或者使用BCEWithLogitsLoss来结合sigmoid和BCE，这样数值稳定性更好。还有L1Loss，也就是MAE，适用于回归问题中对异常值不敏感的情况。另外，像NLLLoss需要手动处理log softmax，这可能用在某些特定的模型结构中，比如结合LogSoftmax层。HuberLoss结合了MAE和MSE的特点，在接近目标时使用MSE，远离时用MAE，适合有噪声的数据。这些都需要详细说明。然后，用户可能需要示例代码来理解如何使用这些损失函数。比如在模型训练时，如何初始化损失函数，计算损失值，并进行反向传播。要注意输入的形状是否正确，比如CrossEntropyLoss的输入是(N, C)而目标是(N)，而BCELoss的输入和目标形状要相同。还需要提到一些注意事项，比如确保输入的范围合适，比如BCELoss的输入应该在0到1之间，或者使用BCEWithLogitsLoss来自动处理。同时，分类任务中标签的类型是否正确，比如是LongTensor还是FloatTensor。可能用户在实际应用中会遇到问题，比如维度不匹配或者未正确处理激活函数，所以在回答时要强调这些常见错误点。此外，引用文档中的内容，比如引用[3]提到模块的组合使用，可以提醒用户参考官方文档获取更详细的信息。最后，生成相关的问题，帮助用户扩展知识，比如如何自定义损失函数，多标签分类用什么损失函数，或者损失函数在反向传播中的作用。这些问题可以引导用户进一步学习相关的内容。</think>以下是PyTorch $torch.nn$ 模块中常用损失函数及其使用方法的详细说明： --- ### 1. 均方误差损失 (MSE Loss) **函数名**：$nn.MSELoss()$ **用途**：回归任务，计算预测值与目标值的均方误差 **公式**： $$L = \frac{1}{N}\sum_{i=1}^{N}(y_i - \hat{y}_i)^2$$ **代码示例**： ```python import torch.nn as nn loss_fn = nn.MSELoss() output = model(inputs) loss = loss_fn(output, targets) # output和targets形状需相同 ``` --- ### 2. 交叉熵损失 (CrossEntropyLoss) **函数名**：$nn.CrossEntropyLoss()$ **用途**：多分类任务，自动结合$Softmax$和负对数似然 **输入要求**： - 预测值：未归一化的logits，形状为$(N, C)$（$C$为类别数） - 目标值：类别索引，形状为$(N)$，数据类型为$torch.LongTensor$ **代码示例**： ```python loss_fn = nn.CrossEntropyLoss() output = model(inputs) # 输出形状为(batch_size, num_classes) loss = loss_fn(output, targets) # targets形状为(batch_size) ``` --- ### 3. 二元交叉熵损失 (BCELoss) **函数名**：$nn.BCELoss()$ **用途**：二分类任务，需配合$Sigmoid$激活函数使用 **输入要求**： - 预测值：经过$Sigmoid$的输出，范围在$[0,1]$ - 目标值：与预测值形状相同的浮点张量 **代码示例**： ```python loss_fn = nn.BCELoss() output = torch.sigmoid(model(inputs)) # 必须显式应用Sigmoid loss = loss_fn(output, targets.float()) ``` > 推荐使用$nn.BCEWithLogitsLoss()$（结合Sigmoid和BCELoss，数值稳定性更好）[^2] --- ### 4. L1损失 (绝对误差损失) **函数名**：$nn.L1Loss()$ **用途**：回归任务，对异常值敏感度低于MSE **公式**： $$L = \frac{1}{N}\sum_{i=1}^{N}|y_i - \hat{y}_i|$$ **代码示例**： ```python loss_fn = nn.L1Loss() loss = loss_fn(output, targets) ``` --- ### 其他重要损失函数 | 函数名 | 应用场景 | 特点 | |----------------------|----------------------------|-----------------------------------| | $nn.NLLLoss()$ | 需手动添加$LogSoftmax$的分类任务 | 输入为概率对数 | | $nn.KLDivLoss()$ | 概率分布相似性度量 | 用于模型蒸馏等场景 | | $nn.HuberLoss()$ | 回归任务的鲁棒损失 | 结合MSE和MAE特性 | | $nn.CosineEmbeddingLoss()$ | 向量相似度比较 | 用于文本/图像匹配任务 | --- ### 使用注意事项 1. **输入形状匹配**：如$CrossEntropyLoss$要求预测值为$(N,C)$，目标为$(N)$[^3] 2. **激活函数配合**：$BCELoss$需显式使用$Sigmoid$，而$CrossEntropyLoss$自动包含$Softmax$ 3. **数值稳定性**：优先选择带"WithLogits"的版本（如$BCEWithLogitsLoss$） 4. **自定义损失**：可通过继承$nn.Module$实现自定义损失函数 ---