BP反向传播网络

最新推荐文章于 2025-11-24 11:51:29 发布

原创最新推荐文章于 2025-11-24 11:51:29 发布 · 651 阅读

·

8

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #回归 #神经网络

AIStudy 专栏收录该内容

19 篇文章

订阅专栏

梯度下降法

在这里插入图片描述

本质上，在神经网络中实现的梯度下降和在线性回归和逻辑斯特回归这两件事上的梯度下降的步骤没有什么不同
不同的是，神经网络中，参数非常多，它的梯度可能是个上百维的一个梯度
反向传播是一种，为了让你计算梯度更有效率的一种衍生法

链式法则

——这是反向传播中为数不多需要掌握的数学

在这里插入图片描述

$损失函数\\ L(\theta)=\sum_{n=1}^NC^n(\theta)\\$

$损失函数求导\\ \frac{\partial L(\theta)}{\partial w}=\sum_{n=1}^N\frac{\partial C^n(\theta)}{\partial w}$

——下面的步骤，我们只focus在对某一个data上的偏微分

——后续的是，讲所有的训练集上的偏微分计算出来，求和，就能得到total loss对这一参数的偏微分

Cal. Example

在这里插入图片描述

——我们将 $∂z/∂w\partial z / \partial w$ 称为向前，对所有的参数（z是未经过激活函数的值）

——我们将 $∂C/∂z\partial C / \partial z$ 称为向后，对所有的激活函数

向前

在这里插入图片描述

——我们会发现， $∂z/∂w\partial z/\partial w$ 的值，就是这个权值前面接的是什么

在这里插入图片描述

向后

Compute $∂C/∂z\partial C/\partial z$ for all activation function inputs z

在这里插入图片描述

C是交叉熵

——通过假设 $a=σ(z)a=\sigma(z)$ 假设z通过的是逻辑回归函数

——得到
$\frac{\partial C}{\partial z}=\frac{\partial a}{\partial z}\frac{\partial C}{\partial a}$
——a会用过下一部分的 $z^{'}$ 和 $z^{''}$ 影响最后的交叉熵C

——因此得到
$\frac{\partial C}{\partial a}=\frac{\partial z'}{\partial a}\frac{\partial C}{\partial z'}+\frac{\partial z''}{\partial a}\frac{\partial C}{\partial z''}$
——而后面的两个部分又是下一层网络的偏微分

假设 $∂C∂z′\frac{\partial C}{\partial z'}$ 和 $∂C∂z′′\frac{\partial C}{\partial z''}$ 已知

则得
$\frac{\partial C}{\partial z}=\sigma'(z)[w_3 \frac{\partial C}{\partial z'}+w_4 \frac{\partial C}{\partial z''}]$

在这里插入图片描述

输出层反向传输

我们假设，上图红点就已经是输出层

$\frac{\partial C}{\partial z'}=\frac{\partial y_1}{\partial z'}\frac{\partial C}{\partial y_1}$

$∂y1∂z′\frac{\partial y_1}{\partial z'}$ 取决于最后输出层的激活函数
$∂C∂y1\frac{\partial C}{\partial y_1}$ 取决于你怎么定义的Loss Function——你可以用交叉熵，也可以使用mean square error

——如果你的下一层不是输出层，则继续看下一层的下一层，直到最后输出层之后

——因此，我们的计算，直接从最后往前面进行误差传播

在这里插入图片描述

总结

在这里插入图片描述

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Caaaaaan 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。