BP神经网络之理论推导
一、 神经网络简介
神经元细胞
在19世纪,人们发现了人脑神经细胞传导兴奋的规律,计算机科学家们由此受到启发,提出来人工神经网络,希望用这个模型来模拟人脑。
神经元细胞有几个重要组成:轴突,树突,细胞体。轴突能将神经元的兴奋传递给其连接的神经元,而树突能够接收其他神经元传递过来的兴奋。神经元细胞根据接收到的兴奋决定是否将兴奋传递给下一个神经元细胞。
神经元模型
将神经元细胞抽象为数学模型,输入为(x1,x2,…,xn), 每个输入都对应一个权重(w1,w2,…,wn),θ为神经元的偏置,决定是否输出信号。F(z)为激活函数,将实数范围压缩到0至1。Y为神经元的输出。
可以假设x0=1,w0=−θ。上式可以改写为y=f(wTx)
二、神经网络正向计算
目前提出的神经网络模型很多,但最常用的还是前馈神经网络。
下面先定义描述神经网络的参数:
1. wl 第l层到第l+1层之间的权重矩阵,矩阵的维数为Nl+1×Nl
2. al 第l层的神经元的输出向量
3. zl 第l层神经元输入的加权和向量
4. x 神经网络的输入向量
5.
6. L 神经网络的层数
7.
8. g(z) 神经元的激活函数
根据定义我们可以得到
zl=wTal
al+1=g(zl) 增加偏置 al+10=1
其中 a1=x,y=aL
根据上式不断迭代 计算出 即可得到神经网络的最终输出结果。
三、 误差逆传播算法
神经网络的损失函数为
学习神经网络就是要学习权重矩阵。可以根据梯度下降的优化方法求出权重矩阵的最优值。
有因为zl+1i=wli∗⋅al,所以
令δl+1i=∂J∂zl+1i,且∂zl+1i∂wlij=alj,即可得:
对于δli=∂J∂zli 有两种情况
1. 当l=L,即为最后一层时
2. 当l为任意一层时
将(6)(7)(8)写成向量形式,最终得到BP神经网络的理论公式
本文详细介绍了BP神经网络的基础,包括神经元细胞的构成及其数学模型,接着阐述了神经网络的正向计算过程,特别是前馈神经网络的参数定义和计算步骤。最后,探讨了误差逆传播算法,给出了损失函数和反向传播的求解公式,为理解BP神经网络的训练机制提供了理论基础。
701

被折叠的 条评论
为什么被折叠?



