深度学习反向传播

何仙鸟

于 2025-03-06 22:12:43 发布

阅读量371

点赞数 7

分类专栏： PyTorch 文章标签：人工智能算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_55843921/article/details/146077917

版权

PyTorch 专栏收录该内容

30 篇文章

订阅专栏

一、白话解释

梯度其实就是导数，除了用符号求导也可以用近似求导：

然后更新w=w-学习率*导数

反向传播就是链式求导

向前计算：对每个节点求偏导

在前向传播的时候，进行一次前向计算的时候就可以把每一条线的偏导数都知道

前向传播和反向传播是交替进行的

二、反向传播

反向传播全称误差反向传播算法，其核心思想是通过链式法则（Chain Rule）将预测误差从输出层逐层反向传递至输入层，从而计算损失函数对每个参数的梯度。这些梯度随后被用于参数更新（如梯度下降法），以最小化模型预测误差。

步骤

1.前向传播

某层神经元加权输入再激活输出

2.计算损失

比较预测输出与真实标签，计算损失值（均方误差、交叉熵）

3.反向传播

从输出层开始，计算损失对输出的梯度也就是损失对激活输出求导，然后逐层反向传播，利用链式求导法则计算各层参数的梯度（导数）。

4.参数更新

用梯度下降法进行更新参数

示例：

比如计算某神经元的误差：

然后修改权重：

PyTorch主要使用符号微分，因为有计算简化，这样计算量会小很多。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

何仙鸟 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。