【ML】反向传播 —BackPropagation

原创于 2021-11-17 21:02:50 发布 · 274 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #深度学习

机器学习专栏收录该内容

1 篇文章

订阅专栏

本文深入讲解反向传播算法原理，包括链式法则的应用、正向与反向传递过程及偏导数计算方法，帮助读者理解神经网络训练的核心机制。

反向传播 —BackPropagation

Grandient Descent

梯度下降通过使用Loss function 对model中的每个参数进行求偏微分最后通过learnig rate 对model进行更新

但是一般大型的神经网络都会有上百万个类似于w\b 这样的参数，如何计算这样的梯度是Backprogation要做的事情。

Backprogation就是一个特殊的梯度下降算法

链式求导

BackProgation——Forward pass(正向传导)

定义一个函数**C^n**表示yn和y’^n的距离
所以当前network的paramter的loss就是

对某一参数进行偏微分时

我们使用一种方法，不需要对所有的paramer进行偏微分，而是对某一笔data进行偏微分就能得到得到grandet

我们以一个genurel举例：

如何计算偏导？首先使用链式法则：

所以我们得到一个规则：一个神经元对一个paramer的求导就是相应路径上的输入

所以我们可以得到每一个paramer，前的nuerel对相依参数的偏微分：就是前一层传入的input

BackProgation——Backward pass（反向传导）

首先我们求解？

根据图片我们可以看到如下思路：

sigmoid 函数和它的微分函数图像

C对A的偏微分可以分解：[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-foF9m1zW-1637154131172)(…/…/…/AppData/Roaming/Typora/typora-user-images/image-20210721103841464.png)]

前一项好理解，但是如何理解第二项的偏微分呢？

根据图片我们可以看到z对C的影响通过影响z’和z’'来实现的，所以有链式法则：

根据之前得到的规则有：

可以得到w3,w4分别是其中两项的值；

现在我们的目标是求出C对z’的偏微分和C对z’'的偏微分：

我们使用逆向思维：

z是一个常数，一个固定的值，在我们做正向传导的时候我们已经知道它是多少了，所以他是一个常数，所以也是一个常数。

所以，目前我们的目标就是计算和
此时，计算这两项的思路仍然和之前一样：

但是如果存在第二层的话：又要进行之前的操作，所以这是一种思想：递归，我们可以通过计算机计算出最终的结果。

就是反向计算偏微分利用规律来计算偏微分;

这就是Backpropagation。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。