激活函数softmax的反向推导

楓尘林间

于 2022-06-11 20:55:36 发布

阅读量1.2k

点赞数

分类专栏：深度学习文章标签：线性代数深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/bowenlaw/article/details/125237713

版权

softmax 的公式大家都应该知道

$S\left(y_{i}\right)=\frac{e^{y i}}{\sum_{j} e^{y j}}$

正向传播很简单，示意图借用知乎用户@香菜的

在这里插入图片描述

其中loss是交叉熵损失函数

$C=-\sum_{i=1}^{m} y_{i} \log p_{i}$

方向传播

反向传播则是本文关注的重点：

在这里插入图片描述

假设3分类分为[0,1,2]，此时输出的label 为 0，即y0=1,y1=0,y2=0

$J = -(y_0*logp_0+y_1*logp_1+y_2*logp_2)$

第一步对loss求偏导

由于y0=1,y1=0,y2=0

$\frac{\partial J}{\partial p_{0}} =- \frac{1}{p0},\frac{\partial J}{\partial p_{1}} =0,\frac{\partial J}{\partial p_{2}} =0$
用矩阵来表示则为：

$\frac{\partial J}{\partial p}=\left[\begin{array}{c}-\frac{1}{P_{0}} \\ 0 \\ 0\end{array}\right]$

第二步对p求偏导(重点)

接下来，计算

$\frac{\partial p_{k}}{\partial{ score }_{i}} =\left[\begin{array}{lll}\frac{\partial P_{0}}{\partial S_{0}} & \frac{\partial P_{1}}{\partial S_{0}} & \frac{\partial P_{2}}{\partial S_{0}} \\ \frac{\partial P_{0}}{\partial S_{1}} & \frac{\partial P_{1}}{\partial S_{1}} & \frac{\partial P_{2}}{\partial S_{1}} \\ \frac{\partial P_{0}}{\partial S_{2}} & \frac{\partial P_{1}}{\partial S_{2}} & \frac{\partial P_{2}}{\partial S_{2}}\end{array}\right]$

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。