一、softmax介绍
定义:
将si替换成aj
应用:分类问题结果的归一化处理
二、sofmax求导
C为交叉熵损失函数:
导数:

为什么要将下角标通过j和i区分呢?

如图,在这种情况下,其他类别预测的y值也会 影响softmax的结果。
①如果i=j:ai * (1 - ai)
②如果i≠j:-ai * aj
与交叉熵损失函数结合结果为:
= ai - yi
参考资料:具体推导过程见链接1,2。图示见链接3
本文介绍了softmax函数的定义及在分类问题中的应用,并详细探讨了softmax的导数计算,特别是与交叉熵损失函数结合的情况。导数分析揭示了不同类别预测概率如何影响softmax结果。
一、softmax介绍
定义:
将si替换成aj
应用:分类问题结果的归一化处理
二、sofmax求导
C为交叉熵损失函数:
导数:

为什么要将下角标通过j和i区分呢?

如图,在这种情况下,其他类别预测的y值也会 影响softmax的结果。
①如果i=j:ai * (1 - ai)
②如果i≠j:-ai * aj
与交叉熵损失函数结合结果为:
= ai - yi
参考资料:具体推导过程见链接1,2。图示见链接3
8404

被折叠的 条评论
为什么被折叠?