详解Softmax多分类算法及交叉熵（Cross-Entropy）成本函数（附代码实现、计算过程、公式）

原创

已于 2023-10-27 20:51:06 修改 · 3.1k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #分类 #人工智能 #机器学习 #深度学习 #神经网络

于 2023-10-26 20:51:24 首次发布

本文介绍了用于多类别分类问题的激活函数Softmax，它将实数向量转换为概率分布。还提到了One-hot独热编码技术，用于处理分类特征。阐述了softmax的成本函数——多分类交叉熵，最后给出了Tensorflow代码实现及优化思路，以减少精度丢失。

Softmax简介

Softmax 是一个用于多类别分类问题的激活函数，它通常用于神经网络的输出层。

Softmax 函数将一个实数向量转换为概率分布，其中每个元素表示一个类别的概率。

简单来说，Softmax的输出代表了一个样本属于某一类别的概率。

输出是概率分布：Softmax 将输入转换成一个概率分布，其中每个元素表示相应类别的概率。这意味着所有输出元素的总和将等于 1。

分类任务：Softmax 常用于多类别分类问题，其中有多个互斥的类别需要被分配概率。

图中，an代表了该y=n的概率预测。

注意：实际操作中，并不推荐使用y=10这样的形式，因为会使得成本函数计算时产生偏见，即10本身会让成本函数变大。推荐使用下文中的one-hot独热编码对标签进行重构。

One-hot独热编码

独热编码（One-Hot Encoding）是一种用于将分类数据转换成机器学习算法可以更好理解的形式的技术。它常用于处理分类特征，将每个分类

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Brandonn_Xu

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Softmax 函数：深度学习中的概率大师

Dfreedom.的博客

11-06

942

本文深入解析了Softmax函数在深度学习多分类任务中的关键作用。通过将神经网络的原始输出(logits)转换为合法的概率分布，Softmax满足了非负性和归一性两大要求，使结果具有明确概率解释。文章详细拆解了Softmax的数学原理和计算过程，阐述了其与交叉熵损失函数的完美配合优势，并分析了指数函数的放大效应特性。同时指出Softmax的局限性（如类别互斥假设）及替代方案（如温度Softmax）。最后给出实用建议：Softmax适用于单标签互斥分类任务，但不适合多标签或类别极多的情况。全文通过具体示例和代

PyTorch中的交叉熵函数 CrossEntropyLoss的计算过程

人工智能

04-29

1663

关于CrossEntropyLoss() 函数的计算过程可以拆解为如下四个步骤：1、对输出的结果进行操作,因为操作可以将所有输入值都归为[0,1]之间，且所有值之和为1，符合概率分布的特性。2、对结果进行log运算，求出都是小于0的值3、对真实概率值进行编码4、利用下面的公式求出最终的loss值CrossEntropyLossx−i1∑nOneHottargeti∗logsoftmaxinputi。

1 条评论您还未登录，请先登录后发表或查看评论

1 条评论

优快云-Ada助手 2023.10.27
恭喜您撰写了第12篇博客！标题中详细描述了Softmax多分类算法及交叉熵成本函数，以及附带了代码实现、计算过程和公式，这样的内容对读者来说非常有用。我很欣赏您在每篇博客中都提供了深入的解释和实际的代码示例。作为下一步的创作建议，我建议您可以考虑在博客中加入更多的实例和案例分析，以帮助读者更好地理解Softmax多分类算法和交叉熵成本函数的应用。另外，您可以尝试探索一些相关的优化技术或进一步扩展这些概念，从而使您的博客更加全面和专业。非常期待您未来更多精彩的博客！

多分类交叉熵

Jerry的博客

04-02

1880

要理解多分类交叉熵损失的由来，首先需要掌握信息论中的两个基础概念：熵（Entropy）和交叉熵（Cross-Entropy）。熵（Entropy）熵衡量一个随机变量的不确定性。对于一个离散随机变量 XXX（例如类别分布），其熵定义为： H(X)=−∑i=1Cpilog⁡(pi) H(X) = -\sum_{i=1}^{C} p_i \log(p_i) H(X)=−i=1∑Cpilog(pi)交叉熵（Cross-Entropy） 交叉熵衡量两个概率分布 PPP（真实分布）和 QQQ（预测分布）之间的差

一文搞懂交叉熵在机器学习中的使用，透彻理解交叉熵背后的直觉

热门推荐

史丹利复合田的博客

01-25

27万+

关于交叉熵在loss函数中使用的理解 交叉熵（cross entropy）是深度学习中常用的一个概念，一般用来求目标与预测值之间的差距。以前做一些分类问题的时候，没有过多的注意，直接调用现成的库，用起来也比较方便。最近开始研究起对抗生成网络（GANs），用到了交叉熵，发现自己对交叉熵的理解有些模糊，不够深入。遂花了几天的时间从头梳理了一下相关知识点，才算透彻的理解了，特地记录下来，以便日后查阅。

多分类交叉熵理解

计算机视觉之光

11-17

3828

介绍交叉熵损失的计算方法和示例。

二分类交叉熵，多分类交叉熵，focal loss

zhuhuigege的博客

03-08

2万+

1：二分类交叉熵 a) 公式：，其中表示网络预测结果，是一个属于（0到1）的值，我们当然希望它们的值很接近1。是真实标签，因为是二分类，所以，的值为0或者1。网络最后一层一般为sigmoid。比如，网络最后一层sigmoid之后，网络输出为0.8，若= 1，代入公式则loss = -1*log(0.8)；若= 0，loss=(1-0)*log(1-0.8)。 b) pytorch中的形式： criterion1 =...

关于交叉熵（Cross Entropy）与Softmax

qqq_aaa_zzz1的博客

08-20

4939

目录写在前面 KL散度 交叉熵 Softmax 交叉熵与Softmax的关系 交叉熵损失 Softmax的求导堆叠+向量化其他关于Softmax函数的问题赠品写在前面 Softmax、交叉熵、交叉熵损失是机器学习与神经网络模型的重要组成部分，一般来说，Softmax一般用于criterion(标准)，交叉熵与交叉熵损失用来衡量模型预测与实际结果间的差别并产生用于反向传播的梯度。...

softmax与多分类

weixin_30306905的博客

03-01

630

sotfmax 函数在机器学习和深度学习中有着广泛的应用，主要用于多分类问题。 softmax 函数 1. 定义假定数组V，那么第i个元素的softmax值为也就是该元素的指数除以所有元素的指数和，取指数是为了使差别更大。于是该数组的每个元素被压缩到(0,1)，并且和为1，其实就变成了概率。在多分类问题中代表了该元素被取到的概率。例如 2....

Softmax回归模型（多分类模型）

m0_53881899的博客

07-24

3229

Softmax回归模型（多分类模型）

神经网络中的交叉熵（Cross-Entropy）损失函数详解

最新发布

不积跬步，无以至千里；不积小流，无以成江海。

06-21

1244

在神经网络和机器学习领域，损失函数是衡量模型预测值与真实值之间差异的核心工具。交叉熵（Cross-Entropy）损失函数，作为一种广泛使用的分类损失函数，尤其在处理多分类问题时表现出色。它不仅具有坚实的理论基础，还在实际应用中展现出卓越的性能。

多标签softmax + cross-entropy交叉熵损失函数详解及反向传播中的梯度求导

BrightLamp的博客

11-14

4548

LLM - CLIP 算法的 Loss 详解和 交叉熵 CrossEntropy 实现

AGI

06-01

2万+

CLIP：Contrastive Language–Image Pre-training(可对比语言-图像预训练算法)是OpenAI提出的多模态预训练的算法，在各种各样的**样本对(图像、文本)**上训练的神经网络。具体参考：CLIP、OpenCLIP其中，流程：和的具体源码如下，参考 model.py：其中，labels是，参考train.py，具体如下 交叉熵函数：y就是label，，表示在x_softmax中筛选第i个sample的第y[i]个值，作为log的输入，全部log负向求和，再求均值。参

softmax多分类

booze_的博客

07-16

6537

Dense是把一个一维的数据映射到另一个一维的数据，不能把二维的数据进行运算，所以我们要把fashionmnist数据先扁平成一维的，

softmax的多分类

Harrytsz的博客

09-08

3154

关于多分类 我们常见的逻辑回归、SVM等常用于解决二分类问题，对于多分类问题，比如识别手写数字，它就需要10个分类，同样也可以用逻辑回归或SVM，只是需要多个二分类来组成多分类，但这里讨论另外一种方式来解决多分类——softmax。关于softmax softmax的函数为 P(i)=\dfrac{exp(\theta_i^Tx)}{\sum_{k=1}^{K}exp(\the...

Softmax多分类算法

weixin_33898876的博客

12-06

List<double[]> inputs_x = new List<double[]>(); inputs_x.Add(new double[] { 0.2, 0.3 }); inputs_x.Add(new double[] { 0.2, 0.1 }); inputs_x.Add(new ...

7.softmax多分类

potato123232的博客

09-23

1456

目录 1概念 2代码实现 2.1导入库 2.2加载数据 2.3归一化 2.4建立模型 2.5编译模型 2.6训练模型 2.7评估模型 2.8预测模型 3使用独热编码完成fashion_mnist训练 3.1导入库 3.2读数据 3.3转换独热编码 3.4归一化 3.5构建模型并编译 3.6训练模型 3.7评估模型 3.8预测模型 1概念上一章我们做的是softmax二分类，这次我们...

多分类-softmax

u010132497的博客

04-03

438

本文来自于网易云课堂 Softmax回归前面介绍的都是2分类问题，如果是多分类的问题怎么办呢？最后一层输出的是一个向量，里面代表了各个概率，其总和为1。对于l-1层，训练过程和二分类一样，对于l层，激活函数有些区别，需要输入一个4*1维向量然后归一化输出4*1维向量。 Z[l]=W[l]a[l−1]+b[l]Z[l]=W[l]a[l−1]+b[l]Z^{[l]} = W...

解锁机器学习多类分类之门：Softmax函数的全面指南

Von_016's Blog

02-08

5744

Softmax函数是机器学习和深度学习中的一个重要概念，特别是在处理分类问题时。它通过提供一个概率分布，使得模型的输出更加直观和易于解释。虽然实现时需要考虑数值稳定性问题，但正确使用Softmax函数可以大大提高多类分类问题的处理效率和准确性。

「机器学习」softmax解决多类问题

qq_52063383的博客

01-16

1211

「吴恩达」机器学习笔记 - 多分类问题

损失函数：CLIP算法的Loss详解和 交叉熵CrossEntropy实现_clip loss

03-11

好的，用户想了解CLIP算法中的损失函数以及如何用交叉熵实现它。首先，我需要回忆一下CLIP的基本原理。CLIP是Contrastive Language-Image Pretraining的缩写，主要目的是将图像和文本映射到同一个嵌入空间，使得配对...