bp前向传播和反向传播举例

最新推荐文章于 2024-08-06 11:45:10 发布

原创最新推荐文章于 2024-08-06 11:45:10 发布 · 316 阅读

CC 4.0 BY-SA版权

文章标签：

33 篇文章

订阅专栏

30 篇文章

订阅专栏

本文介绍了反向传播（BP）算法的基本原理，它是神经网络中最有效的学习方法。BP通过前向传播计算损失，然后利用梯度下降法反向更新权重，以最小化误差。链式求导法则在BP中用于计算多层网络中各参数的梯度。在面试中，理解并能清晰解释这些概念对于展示你的深度学习知识至关重要。

2.4 简单阐述一下BP的过程？

BP(Back Propogation)算法是一种最有效的学习方法，主要特点是信号前向传递，而误差后向传播，通过不断调节网络权重值，使得网络的最终输出与期望输出尽可能接近，以达到训练的目的。前向过程中通过与正确标签计算损失，反向传递损失，更新参数，优化至最后的参数。

而面试的过程中，我们可以拿出一支笔，给面试官直接说，“老师，我来直接写一个吧，您看看呗？”

“你看哈，我这一个两层的神经网络。其中 $x$ 是网络的输入， $y$ 是网络的输出， $w$ 是网络学习到的参数。"

“在这里， $w$ 的值就是我们需要更新的目标，但是我们只有一些 $x$ 与跟它对应的真实 $y = f (x)$ 的值，所以呢？我们需要使用这两个值来计算 $w$ 的值了，整个问题就转变成了下面的优化问题了，也就是我们需要求函数的最小值。”

在实际中，这类问题有一个经典的方法叫做梯度下降法。意思是我们先使用一个随机生成的 $w$ ，然后使用下面的公式不断更新 $w$ 的值，最终逼近真实效果。

$w^{+}=w-\eta \cdot \frac{\partial E}{\partial w}$

这里 $w$ 是一个随机初始化的权重， $\frac{\partial E}{\partial w}$ 是表示当前误差对权重 $w$ 的梯度。 $\eta$ 是表示的学习率，通常不会很大，都是0.01以下的值，用来控制更新的步长。

若 $y = g (x)$ , $z = f (y)$ ,那么 $z = h (x)$ ,其中 $\circ g$ 。其中 $\frac{d y}{d x}=g^{\prime}(x), \frac{d z}{d y}=f^{\prime}(y)$ 。

当我们需要求 $z$ 对 $x$ 的导数 $\frac{d z}{d x}$ 就需要使用链式求导了。根据我们之前学过的知识：

$h^{\prime}(x)=\frac{d z}{d x}=\frac{d z}{d y} \cdot \frac{d y}{d x}$

这里说的都还是以单变量作为例子，实际中，多维变量就是变成了求偏导数了。

OK！基本上面试的时候，答到这个份儿上了，就已经够了！！