23、神经网络训练全解析：从反向传播到损失函数与权重初始化

tree

于 2025-08-12 10:43:55 发布

阅读量35

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习入门：从零开始文章标签：神经网络反向传播损失函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/tree/article/details/151055302

深度学习入门：从零开始专栏收录该内容

43 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

神经网络训练全解析：从反向传播到损失函数与权重初始化

1. 反向传播基础回顾

在简单的神经网络中，我们可以通过链式法则来计算更新权重所需的梯度。经过前向传播后，我们能得到以下权重梯度方程：
- $\frac{\partial L}{\partial w_3} = (y - \hat{y})w_2w_1x$
- $\frac{\partial L}{\partial w_2} = (y - \hat{y})w_3w_1x$
- $\frac{\partial L}{\partial w_1} = (y - \hat{y})w_3w_2x$

根据梯度下降的更新规则，权重更新公式如下：
- $w_3 \leftarrow w_3 - \eta \frac{\partial L}{\partial w_3} = w_3 - \eta(y - \hat{y})w_2w_1x$
- $w_2 \leftarrow w_2 - \eta \frac{\partial L}{\partial w_2} = w_2 - \eta(y - \hat{y})w_3w_1x$
- $w_1 \leftarrow w_1 - \eta \frac{\partial L}{\partial w_1} = w_1 - \eta(y - \hat{y})w_3w_2x$

其中，$\eta$ 是学习率，用于控制更新步长。

2. 通用反向传播方法

为了更通用地计算任意网络的梯度，我们重新审视损失函数并引入新的符号。损失函数是网络所有参数（权重和偏置）的函数。例如，一个具有 20 个权重和偏置的网络，其损失函数可表

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。