交叉熵代价函数
基本完成了些许期末考试,特意来补一些softmax,因为涉及到损失函数。损失函数一般分为mse,与交叉熵,对于softmax来说损失函数一般采用交叉熵。今天补一下交叉熵的概念。
交叉熵
熵的概念:熵的本质是香农信息量log1p 现有关于样本集的2个概率分布p和q,其中p为真实分布,q非真实分布。按照真实分布p来衡量识别一个样本的所需要的编码长度的期望(即平均编码长度)为H(p)=p(i
这篇博客介绍了交叉熵代价函数在深度学习中的应用,包括熵和交叉熵的概念,以及相对熵(KL散度)。文章指出交叉熵常作为损失函数,衡量真实标记分布与模型预测分布的相似性,且在梯度下降中优于均方误差函数。
基本完成了些许期末考试,特意来补一些softmax,因为涉及到损失函数。损失函数一般分为mse,与交叉熵,对于softmax来说损失函数一般采用交叉熵。今天补一下交叉熵的概念。
交叉熵
熵的概念:熵的本质是香农信息量log1p 现有关于样本集的2个概率分布p和q,其中p为真实分布,q非真实分布。按照真实分布p来衡量识别一个样本的所需要的编码长度的期望(即平均编码长度)为H(p)=p(i

被折叠的 条评论
为什么被折叠?