cs231n笔记（6）--反向求导

最新推荐文章于 2024-05-11 07:24:34 发布

原创最新推荐文章于 2024-05-11 07:24:34 发布 · 2.6k 阅读

3 ·

CC 4.0 BY-SA版权

传统BP神经网络专栏收录该内容

8 篇文章

订阅专栏

本文解释了反向传播（BP）算法中的梯度下降原理，通过调整神经网络中的权重来最小化损失函数，实现对识别误差的优化。

一.理解

反向求导在BP算法中也叫梯度下降，我对其的理解就是为了让最后的损失函数损失最小化（即识别误差最小），如何让最后误差最小呢？由于导数在几何上的意义是函数上升或者下降的趋势，那么我们可以把整个人工神经网络+损失函数的模型看成是一步一步的函数叠加的结果，输入为图像，输出为损失。那么每一个神经元（激活函数）以及之后损失函数都会对最后的误差结果产生影响。反向求偏导后（链式法则，每一步都对输入x求偏导）每一个神经元和误差函数都会有与之对应的导数，我们可以简单理解为当导数为正，有输入时（默认输入都为正去理解），此结点会让最后输出的误差变大，此后我们调节时就将此结点对应W变小。当导数为负时相反。举个简单例子：