1. L L 层神经网络的前向传播:
设第 层的权值矩阵为 Wl W l ,输出为 zl z l ,激活值为 al a l , 激活函数都选用 σ σ ,误差函数选择均方误差,则有如下关系:
zl=Wlal−1+blal=σ(zl)J(W,b,x,y)=12||aL−y||22 z l = W l a l − 1 + b l a l = σ ( z l ) J ( W , b , x , y ) = 1 2 | | a L − y | | 2 2
2. L L 层神经网络的反向传播:
对于输出层 层:
∂J(W,b,x,y)∂WL==∂J(W,b,x,y)∂aL∂aL∂zL∂zL∂WL(aL−y)⨀σ′(zL)(aL−1)T(18)(19) (18) ∂ J ( W , b , x , y ) ∂ W L = ∂ J ( W , b , x , y ) ∂ a L ∂ a L ∂ z L ∂ z L ∂ W L (19) = ( a L − y ) ⨀ σ ′ ( z L ) ( a L − 1 ) T
∂J(W,b,x,y)∂bL==∂J(W,b,x,y)∂aL∂aL∂zL∂