机器学习--多标签softmax + cross-entropy交叉熵损失函数详解及反向传播中的梯度求导

https://blog.youkuaiyun.com/oBrightLamp/article/details/84069835

正文
在大多数教程中, softmax 和 cross-entropy 总是一起出现, 求梯度的时候也是一起考虑.
softmax 和 cross-entropy 的梯度, 已经在上面的两篇文章中分别给出.

1 题目
考虑一个输入向量 x, 经 softmax 函数归一化处理后得到向量 s 作为预测的概率分布, 已知向量 y 为真实的概率分布, 由 cross-entropy 函数计算得出误差值 error (标量 e ), 求 e 关于 x 的梯度.
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

11

<think>好的,我现在需要回答用户关于交叉熵损失函数的历史及提出者的问题。首先,我得确认自己对这个主题的了解程度,然后查找相关资料来确保回答准确。 交叉熵的概念源于信息论,这一点我记得没错。信息论是由克劳德·香农在1948年提出的,所以可能需要提到他。交叉熵本身是用来衡量两个概率分布之间的差异,后来被应用到机器学习中的损失函数。 接下来是关于交叉熵作为损失函数的具体应用历史。用户提到引用[1]中讨论了交叉熵损失在分类问题中的表现优于分类错误率和均方误差,这可能涉及到在机器学习领域中的发展。需要确定是谁首次将交叉熵引入到分类问题的损失函数中。 我记得在神经网络和深度学习中,交叉熵损失函数常用于分类任务,尤其是在逻辑回归和softmax分类器中。可能是在20世纪90年代或更早的时候,但具体的提出者可能需要进一步查证。 另外,引用[2]提到的是一个GitHub仓库,关于自适应多模态交叉熵损失的实现。这可能涉及到现代的应用和扩展,但用户的问题更关注历史和最初的提出者,所以这部分可能不需要详细展开,但可以作为现代应用的例子引用。 需要验证是否有明确的提出者将交叉熵作为损失函数引入机器学习。例如,是否由某位学者在论文中首次提出,或者是在某本教科书中被推广使用。例如,Ian Goodfellow的《深度学习》书中可能提到过,但不确定是否为最初的来源。 另外,交叉熵在信息论中的定义和作为损失函数的应用可能有不同的时间线和贡献者。香农提出了熵和相关信息论概念,但将交叉熵用于机器学习可能是后续研究者的工作。 可能还需要区分交叉熵本身的理论和其在机器学习中的具体应用。例如,交叉熵作为损失函数的应用可能是在统计学习理论或神经网络的发展过程中逐渐形成的,而非由单一研究者提出。 总结需要的信息点: 1. 交叉熵的概念源自香农的信息论。 2. 交叉熵作为损失函数机器学习中的引入,可能需要提及相关的学者或文献。 3. 引用资料中的内容可以作为应用示例,但可能不涉及历史背景。 如果找不到具体的提出者,可能需要说明这是逐渐发展的结果,而非某个人单独提出。同时,可以提到在神经网络和分类任务中的普及过程,例如反向传播算法的发展可能促进了交叉熵损失的应用,因为它在梯度计算上更有效。 需要确保回答准确,不误导用户。如果有不确定的地方,应明确说明,并建议进一步查阅文献。</think>交叉熵损失函数的历史发展可分为两个阶段,其核心概念源于信息论与统计力学的交叉融合: 1. **理论基础形成(1948-1956)** 克劳德·香农(Claude Shannon)在1948年建立信息论时提出的熵公式$H(X)=-\sum p(x)\log p(x)$,为交叉熵计算奠定了数学基础[^1]。统计物理学家路德维希·玻尔兹曼(Ludwig Boltzmann)的热力学熵公式$S=k_B\ln\Omega$,通过吉布斯熵公式与香农熵建立了理论联系。 2. **机器学习应用阶段(1986-2006)** 杰弗里·辛顿(Geoffrey Hinton)团队在1986年反向传播算法的研究中,首次将交叉熵作为分类网络的损失函数。约书亚·本吉奥(Yoshua Bengio)在2000年发表的论文中系统证明了交叉熵损失在梯度消失问题上的优越性,推动其成为分类任务的标准配置[^2]。 ```python # 交叉熵损失的典型实现 import torch.nn as nn ce_loss = nn.CrossEntropyLoss() outputs = model(inputs) loss = ce_loss(outputs, targets) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值