学习笔记-PyTorch-Softmax以及损失计算

最新推荐文章于 2025-10-02 23:14:49 发布

原创

最新推荐文章于 2025-10-02 23:14:49 发布 · 1.3k 阅读

·

30

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#学习 #笔记 #pytorch #jupyter

1.Softmax实现概率分布

分类器的主要功能是确定测试样本所属的类别。以图像识别为例，给定一张车辆的照片，分类器可以识别出该车辆是自行车、电动车还是普通汽车等具体类型。二分类问题是分类问题中最基本的形式，其输出只有两个类别，通常标记为0和1。之前的内容中介绍了线性模型实现二分类问题。在这种情况下，如果样本属于类别0的概率是y，那么它属于类别1的概率就是1−y。因此，模型的输出是一维的，可以使用二元交叉熵损失（BCELoss）来计算损失值。

然而，在大多数实际情况下，类别的数量往往不止两个。在多分类场景中，我们通常训练模型来输出样本属于每个类别的概率，然后根据这些概率进行排序，选择概率最高的类别作为模型的输出。如果继续使用二分类问题的线性模型思路，就会遇到问题。例如，如果类别1的概率 y1 是0.8，类别2的概率 y2 也是0.8，而类别3的概率 y3 是0.7，那么在决定样本的最终类别时就会出现矛盾。尽管 y1 和 y2 的概率最高，理论上应该选择这两个类别之一，但 y3 的概率也不低，同样有一定的可能性。这就是问题所在：我们希望模型的输出是一个明确的概率分布，能够反映样本属于各个类别的相对可能性。也就是说，每个类别都有一个对应的概率值，所有概率值之和为1。

采用Softmax函数将模型的原始输出（logits）转换为概率分布，Softmax计算公式为

使用框架如图所示：

对应代码如下所示，计算出来的损失值为0.9729

import numpy as np
y = np.array([1, 0, 0])
z = np.arr

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。