反向传播手记
原文链接:http://neuralnetworksanddeeplearning.com/chap2.html
反向传播主要应用链式法则计算任意神经元的梯度,四个核心等式:
其中:
δlj≡∂C∂zlj
zlj=∑kwljkal−1k+blj
,代表任意神经元的加权输入
四个等式的意义:
BP1描述了最后一层的
δL
如何计算;
BP2描述了如何根据下层的
δl+1
计算上一层的
δl
BP3和BP4描述了如何根据
δl
算出
ω
和 b的偏导。
反向传播的主要意义是计算各种变量的偏导不再需要求很多次目标函数的值而只需要计算一次,再进行一次反向的传播即可