反向传播

最新推荐文章于 2023-08-01 17:03:44 发布

xxiaozr

最新推荐文章于 2023-08-01 17:03:44 发布

阅读量588

点赞数 1

分类专栏：卷积网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/xxiaozr/article/details/79832101

版权

卷积网络专栏收录该内容

10 篇文章

订阅专栏

通常使用梯度下降的方法优化目标函数，梯度下降需要逐步的更新网络的权重和偏置，最终使网络的误差最小

而更新网络的权重和偏置，需要计算目标函数 C 关于权重或者偏置的偏导数，即和

反向传播算法就是为了计算这些偏导数的

一些参数的的定义：

使用 a 来表示神经元的激活值， b 表示偏置

第 l 层第 j 个神经元的激活值为：，求和是在 l-1 层上所有的 k 个神经元上进行的。

写成矩阵的形式就是：，这个表达方式更好的表达了每层激活值和前一层激活值的关系，仅仅使用权重矩阵作用在激活值上，然后添加一个偏置向量，总用在 δ 函数。

称 z 是神经元的带权输入 , a = δ(z)

引入一个中间量，称之为第 l 层第 j 个神经元上的误差：

四个基本方程：

反向传播给出计算误差的流程然后将其关联到计算和上

（BP1）输出层误差的方程:

第一项，表示代价随着第 j 个神经元输出激活值变化而变化的速度

第二项，表示激活函数在 zjl 处变化的速度

矩阵形式为：，看成是 C 关于输出激活值的改变速度

当使用二次代价函数时， BP1 可以写成：

(BP2) 使用下一层的误差来表示当前层的误差：

假如我们知道 l+1层的误差，应用 l+1 层的 weight 的转置，可以凭直觉看做沿着网络反向传播误差

通过组合 BP1 和 BP2 ，可以计算任何层的误差，

（BP3）代价函数关于网络中任意偏置的改变率：

（BP4）代价函数关于任何一个权重的改变率：

方程式可以用更少的下标表示：，其中第一项是输入给权重 w 的神经元的激活值，第二项是输出自权重 w 的神经元的误差。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。