神经网络的反向传播算法解释（back propagation）

最新推荐文章于 2024-03-06 17:02:38 发布

原创最新推荐文章于 2024-03-06 17:02:38 发布 · 954 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#反向传播 #back propagation #神经网络 #深度学习

Machine Learning 同时被 2 个专栏收录

56 篇文章

订阅专栏

41 篇文章

订阅专栏

最近好多同学在学习神经网络，而神经网络的核心应该就是BP算法了，好多同学对这块不太理解，在此，我就简单说一下。

可以简单总结一句话：复合函数求偏导，

请看下文详细解读：

Forward propagation:

Z1=W1*X0+B1

A1=g(Z1)

Z2=W2*A1+B2

A2=g(Z2)

…..

Zn=Wn*An-1+Bn

An=g(Zn)

以上就是fp的整个计算过程，大概解释一下，由于后面每层的输入均为上一层激活函数的输出值（输入层除外），故而，从Z2开始，其输入值变为An-1, 由于An为最后一层的输出，所以预测值y’=An, 而又因为 An由前面多层传输而来，故而损失函数L(y’,y)=J(W1,B1,W2,B2,…,Wn,Bn)=J

Back propagation:

主要目的是为了求得各层权重的偏导值，进而利用梯度来更新权重以期达到最优效果，即求得dw1=,db1=,……,dWn=,dbn=,也就是说整个求偏导的过程是针对损失函数对每个变量的求偏导过程，为了将 BP过程说的清楚一些，现在可以将每个节点看成两部分组成Z和A。为了更清晰的说明这个过程，请见下图：

对以上式子分别进行说明：

在此处因为A2已经是输出层，故而此处 y hat和A2是一致的，
就是所谓的链导法则，实际上就是复合函数求导的过程
同2
因为 A1和Z2存在函数关系，而式子2中已经求得dZ2,故而此处如上图推到
同2
同3

式子7,8就是更新权重的过程

对 FP和BP 的计算过程可以理解如下

FP的计算顺序，BP的计算顺序

大家也可以关注我的个人公众号：

或者知乎：https://zhuanlan.zhihu.com/albertwang

下面是赞赏码

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。