[Deep Learning] 反向传播算法（Backpropagation Algorithm）

最新推荐文章于 2021-09-16 11:45:30 发布

原创

最新推荐文章于 2021-09-16 11:45:30 发布 · 736 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #算法

本文详细介绍了反向传播算法，通过链式法则解释了如何计算神经网络的权重梯度。首先，阐述了链式法则在两种情况下的应用，接着通过实例详细解释了反向传播的过程，包括前向传播计算∂ωi∂zi和反向传播计算∂z∂l，最后总结了反向传播算法的重要性和工作原理。

Chain Rule（链式法则）

Case 1

如果有：

$g(x)\ \ \ \ \ \ z = h(y)$

那么“变量影响链”就有：

$Δx→ΔyΔz\Delta x\rightarrow \Delta y \Delta z$

因此就有：

$dzdx=dzdydydx\frac{d z}{d x} = \frac{d z}{d y}\frac{d y}{d x}$

Case 2

如果有：

$g(s)\ \ \ \ \ \ y = h(s)\ \ \ \ \ \ z=k(x,y)$

那么“变量影响链”就有：

因此就有：

$dzds=∂z∂xdxds+∂z∂ydyds\frac{d z}{d s} = \frac{\partial z}{\partial x}\frac{d x}{ds} + \frac{\partial z}{\partial y}\frac{d y}{ds}$

Backpropagation（反向传播算法）——实例讲解

定义

反向传播（英语：Backpropagation，缩写为BP）是“误差反向传播”的简称，是一种与最优化方法（如梯度下降法）结合使用的，用来训练人工神经网络的常见方法。该方法对网络中所有权重计算损失函数的梯度。这个梯度会反馈给最优化方法，用来更新权值以最小化损失函数。（误差的反向传播）——维基百科

说明

假设现在有N个样本数据，那么实际上损失函数可以表示为：

$L(θ)=∑n=1Nln(θ)L(\theta) = \sum_{n=1}^Nl^n(\theta)$

其中 $θ\theta$ 为需要学习的参数。

那么现在 $ω\omega$ 对 $L$ 进行偏微分，实际上是对每个样本数据的损失函数 $l(θ)l(\theta)$ 进行偏微分后再求和：

$∂L(θ)∂ω=∑n=1N∂ln(θ)∂ω\frac{\partial L(\theta)}{\partial \omega} = \sum_{n=1}^N\frac{\partial l^n(\theta)}{\partial \omega}$

用代数表示为：

$a1=σ(z1)z_1 = \omega_{11}x_1 + \omega_{12}x_2 + b_1 \ \ \ \ \ \ \ \ \ \ \ a_1 = \sigma(z_1)$

$a2=σ(z2)z_2 = \omega_{21}x_1 + \omega_{22}x_2 + b_2 \ \ \ \ \ \ \ \ \ \ \ a_2 = \sigma(z_2)$

$a3=σ(z3)z_3 = \omega_{31}a_1 + \omega_{32}a_2 + b_3 \ \ \ \ \ \ \ \ \ \ \ a_3 = \sigma(z_3)$

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。