动手学深度学习笔记---4.4 前向传播、反向传播与计算图

最新推荐文章于 2025-01-15 10:24:42 发布

原创

最新推荐文章于 2025-01-15 10:24:42 发布 · 990 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能

在之前对多层感知机的实现过程中，只考虑了感知机在进行前向传播时所进行的计算，对于涉及梯度计算的反向传播并未进行过多赘述，仅调用深度学习框架所提供的反向传播函数进行自动梯度计算。因此在本节内容中，针对深度学习模型在训练时的前向传播以及反向传播过程进行了介绍。

一、前向传播

前向传播过程主要是指按输入层 -> 隐藏层 -> 输出层顺序传递数值进行计算并存储结果的过程。

在这里插入图片描述

以上述图中多层感知机结构为例：

从输入层到隐藏层的计算为：

$z_i = w_1 x +b_1 \\ h_i = ReLU(z)$

从隐藏层到输出层的计算为：

$oi=y^i=w2hi+b2o_i =\hat{y}_i = w_2 h_i + b_2$

通过该过程，神经网络可以得到一个输出值 $y^\hat{y}$ ，用于计算与训练集中真实值 $y$ 的误差，该误差会在反向传播过程中用到，来实现对参数 $[w, b]$ 的修正，输出预测值与真实值的误差损失可用 $L$ 表示：

$l=lloss_function(y^,y)l = l_{loss\_function}(\hat{y},y)$

同时根据之前学到的 $L 2$ 正则定义，对于参数 $w_1,b_1],[w_2,b_2]$ ,将其视作拓展后的矩阵 $W'_1,W'_2$ ，存在给定超参数 $λ\lambda$ ，使得正则化项为：

$s=λ2(∣∣W1′∣∣2+∣∣W2′∣∣2)s=\frac{\lambda}{2}(||W'_1||^2+||W'_2||^2)$

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Aaaaaki

关注关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

深度学习入门（十三）前向传播、反向传播和计算图

ElysiumAILab

11-01

1125

前向传播、反向传播和计算图 教材前向传播前向传播计算图 反向传播 训练神经网络小结

前向传播(Forward Propagation)与反向传播(Back Propagation)举例

qq_43602667的博客

02-19

3999

前向传播(Forward Propagation)与反向传播(Back Propagation)

参与评论您还未登录，请先登录后发表或查看评论

深度学习（3）基础3 -- 前向传播与反向传播

great_yzl的博客

09-15

6105

目录一、前向传播前向传播过程二、反向传播（梯度下降） 1、过程 2、门单元一、前向传播前向传播：从前往后，逐层计算。前向传播过程 1、先得到得分 2、把得分的差异放大（差异化，e^x） 3、归一化，得到概率 4、计算损失值拿到数据之后，先经过得分函数，并不是经过一次变换，而是多次的变换。二、反向传播（梯度下降） 1、意义从后往前，逐层求导，可以得到前一项的权重。例如：三个求偏导意义分别是：x、y、...

【动手学深度学习】前向传播、反向传播和计算图

weixin_45057858的博客

08-16

1027

【动手学深度学习】前向传播、反向传播和计算图

04.7. 前向传播、反向传播和计算图

weixin_45063703的博客

09-11

878

在自动微分之前，即使是对复杂模型的微小调整也需要手工重新计算复杂的导数，学术论文也不得不分配大量页面来推导更新规则。然而当实现该算法时，我们只考虑了通过前向传播（forward propagation）所涉及的计算。前向传播（forward propagation或forward pass）指的是：按顺序（从输入层到输出层）计算和存储神经网络中每层的结果。在本节中，我们将通过一些基本的数学和计算图，深入探讨反向传播的细节。对于前向传播，我们沿着依赖的方向遍历计算图并计算其路径上的所有变量。

前向传播和反向传播（推导示例）

wj1298250240的博客

01-19

931

参考这个： https://blog.csdn.net/qq_16137569/article/details/81449209 前向传播(Forward Propagation) 提一下前向传播过程，即网络如何根据输入得到输出的目的：由输入得到输出值，并算出loss。 Loss指的是模型求解的值和数据label的差距。前传：可理解为一个公司的盈利取决于每个分部门的个人的付出。从底层到高层...

个人学习笔记3：动手学深度学习pytorch版-李沐

浪子L的博客

09-03

1831

主要记录学习笔记，学习书目为李沐老师的《动手学习深度学习》重预备知识开始记录。开源书籍地址：https://zh-v2.d2l.ai/chapter_preface/index.htmll 李沐老师B站视频：https://space.bilibili.com/1567748478/channel/seriesdetail?sid=358497

吴恩达深度学习笔记：深层神经网络(Deep Neural Networks)4.1-4.4

weixin_43597208的博客

04-02

1475

尽管对于任何给定的问题很难去提前预测到底需要多深的神经网络，所以先去尝试逻辑回归，尝试一层然后两层隐含层，然后把隐含层的数量看做是另一个可以自由选择大小的超参数，然后再保留交叉验证数据上评估，或者用你的开发集来评估。我们可以看到，第一层（即左边数过去第二层，因为输入层是第 0 层）有 5 个神经元数目，第二层 5 个，第三层 3 个。,这层是第 0 层，这层左边的隐藏层是第 1 层，由此类推。注意，神经网络的层数是这么定义的：从左到右，由 0 开始定义，比如上边右图，是等于这个神经网络所预测的输出结果。

（六）学习笔记：动手学深度学习（自动求导）

小刘的博客

01-07

2216

自动求导1.链式法则1.1向量的链式法则1.1.1实例一1.1.2实例二2.计算图3.自动求导的两种模式3.1正向累积和反向累积3.2反向累积总结3.3复杂度3.3.1反向累积和正向累积复杂度的对比4.自动微分4.1一个简单的例子4.2 非标量变量的反向传播4.3 分离计算4.4 Python控制流的梯度计算4.5小结4.6练习 1.链式法则这是因为在深度学习中，多元函数通常是复合（composite）的，所以我们可能没法应用上述任何规则来微分这些函数。幸运的是，链式法则使我们能够微分复合函数。让我

《动手学深度学习》PyTorch版本

wzy628810的博客

01-20

8811

本项目对中文版《动手学深度学习》中的代码进行整理，并参考一些优秀的GitHub项目给出基于PyTorch的实现方法。为了方便阅读，本项目给出全书PyTorch版的PDF版本。欢迎大家Download，Star，Fork。除了原书内容外，我们还为每一章增加了本章附录，用于对该章节中用到的函数以及数学计算加以说明，除此之外还增加了语义分割网络（U-Net）的实现。

图解深度学习 - 前向传播和反向传播

最新发布

m0_56255097的博客

01-15

3804

这个过程是神经网络进行训练和推理的基础，也是后续反向传播过程的前提。根据损失函数计算梯度并更新网络参数以优化模型性能的过程，**网络中的权重和偏置进行线性变换，然后通过，得到每一层的输出。最终，输出层的输出即为神经网络的预测值。输入层接收数据：输入层是神经网络的第一层，它接收来自外部的数据。计算隐藏层输出：数据从输入层传递到隐藏层，隐藏层中的每个神经元都会接收来自上一层神经元的输入，并计算其加权和。加权和通过激活函数（如ReLU、Sigmoid、Tanh等）进行非线性变换，生成该神经元的输出。

深度学习：池化层的前向计算和反向传播

m0_60341379的博客

10-10

571

池化层：Max Pooling和Average Pooling 前向计算：标题反向传播：最大池化反向传播中的卷积核中最大值的所在位置和前向计算最大值所在的位置一致，其他位置补0。平均池化的反向传播中的卷积核中的值是将已知的值求平均值。 ...

【深度学习】：计算图上的前向传播算法与反向传播算法

bqw的博客

10-22

1361

全连接神经网络的前向传播和反向传播推导（配图理解）

Medlen

08-23

7828

什么是全连接神经网络？全连接神经网络是指任意两个相邻层之间的神经元全部互相连接。如下图所示：图 1 如何计算全连接神经网络的输出？在进行计算前，我们先对一些变量进行说明，如下图所示：图 2 首先是整个神经网络的输入，我们用 x1,x2,x3...xnx_1,x_2,x_3...x_nx1,x2,x3...xn 来表示神经网络的输入，在上图中输入是： x1,x2,x3x_1,x_2,x_3x1,x2,x3 。为了方便计算我们还可以用向量表示: X=[x1x2x3] X= \left[

【神经网络系列（初级）】计算图解析：神经网络的求导方法——前向模式与反向模式求导的对比与解析

神经美学_茂森的博客

04-11

539

参考文献：分分钟快速掌握“反向传播算法”，这篇文章来源：知乎作者：晓雷 1 用计算图来解释几种求导方法：一些问题 反向传播算法的作用是什么神经网络模型的学习算法一般是SGD。 SGD学习模型 SGD需要用到损失函数C关于各个权重参数的偏导数损失函数C 损失函数C关于各个权重参数的偏导数一个模型的参数w,b是非常多的，故而需要反向传播算法快速计算 反向传播算法是一种计算偏导数的方...

【算法分析】深度学习框架-前向反向传播原理

HaoBBNuanMM的博客

07-18

786

目录背景目标核心方法前向传播 反向传播 结论背景 深度学习框架如Tensorflow Pytorch 等最重要的功能之一即自动对网络模型进行了前向传播和反向梯度传播计算，从而对应用开发人员屏蔽了底层算法实现的细节，很容易进行网络模型的training、evalution、testing 最终构建符合AI应用场景需求的网络模型及其参数，本文旨在用通俗易懂的方式解释前向传播（Forward Pass）和反向传播（Backward Pass）的过程目标 深度学习的目标

前向传播算法与反向传播算法

weixin_45808737的博客

07-01

1690

1.前向传播如图所示，这里讲得已经很清楚了，前向传播的思想比较简单。举个例子，假设上一层结点i,j,k,…等一些结点与本层的结点w有连接，那么结点w的值怎么算呢？就是通过上一层的i,j,k等结点以及对应的连接权值进行加权和运算，最终结果再加上一个偏置项（图中为了简单省略了），最后在通过一个非线性函数（即激活函数），如ReLu，sigmoid等函数，最后得到的结果就是本层结点w的输出。最终不断的通过这种方法一层层的运算，得到输出层结果。对于前向传播来说，不管维度多高，其过程都可以用如下公式表示：

Pytorch 前向传播、反向传播、计算图

caixiaobaideye的博客

01-11

1728

在计算梯度时，我们只调用了深度学习框架提供的反向传播函数，而不知其所以然。梯度的自动计算（自动微分）大大简化了深度学习算法的实现。在自动微分之前，即使是对复杂模型的微小调整也需要手工重新计算复杂的导数，学术论文也不得不分配大量页面来推导更新规则。

温故知新——前向传播算法和反向传播算法（BP算法）及其推导

Stephen

06-17

7527

1. 前向传播算法所谓的前向传播算法就是：将上一层的输出作为下一层的输入，并计算下一层的输出，一直到运算到输出层为止。从上面可以看出，使用代数法一个个的表示输出比较复杂，而如果使用矩阵法则比较的简洁。将上面的例子一般化，并写成矩阵乘法的形式，这个表示方法就很简洁、很漂亮，后面我们的讨论都会基于上面的这个矩阵法表示来。所以，应该牢牢记住我们符号的含义，否则在后面推导反向传播公式时会比较懵。 2. 反向传播算法（BP算法） 反向传播（back propagation, BP）算法是 “误差反向传播