cs231n assignment1 Q4 softmax梯度推导

最新推荐文章于 2019-07-30 11:34:46 发布

tue2015

最新推荐文章于 2019-07-30 11:34:46 发布

阅读量519

点赞数

CC 4.0 BY-SA版权

文章标签： cs231n

本文链接：https://blog.youkuaiyun.com/tue2015/article/details/79896458

本文详细推导了斯坦福cs231n课程2017年版assignment1的第四题，涉及网络结构为输入-全连接层-ReLU-全连接层-softmax。针对每个训练样本，定义并计算了损失函数，然后推导了从softmax层到第二全连接层权重W2的梯度。

本文推导了斯坦福课程cs231n（2017）assignment1 Q4的反向传播梯度

网络结构为
输入–全连接层–ReLU–全连接层–softmax
$X-H=XW_1+b_1-R=\max(\textbf{0},H)-F=RW_2+b_2-\text{softmax}$
其中, $X$ 为输入，每一行表示一个样本， $W_1，W_2$ 分别为第一和第二连接层的权重， $b_1，b_2$ 分别为第一和第二连接层的偏置。 $F$ 为第二连接层的输出（score）。
首先定义损失函数,对于每个训练样本，损失函数定义如下