BP神经网络之理论推导

本文详细介绍了BP神经网络的基础,包括神经元细胞的构成及其数学模型,接着阐述了神经网络的正向计算过程,特别是前馈神经网络的参数定义和计算步骤。最后,探讨了误差逆传播算法,给出了损失函数和反向传播的求解公式,为理解BP神经网络的训练机制提供了理论基础。

BP神经网络之理论推导

一、 神经网络简介

神经元细胞

在19世纪,人们发现了人脑神经细胞传导兴奋的规律,计算机科学家们由此受到启发,提出来人工神经网络,希望用这个模型来模拟人脑。

神经元

神经元细胞有几个重要组成:轴突,树突,细胞体。轴突能将神经元的兴奋传递给其连接的神经元,而树突能够接收其他神经元传递过来的兴奋。神经元细胞根据接收到的兴奋决定是否将兴奋传递给下一个神经元细胞。

神经元模型

将神经元细胞抽象为数学模型,输入为(x1,x2,,xn), 每个输入都对应一个权重(w1,w2,,wn),θ为神经元的偏置,决定是否输出信号。F(z)为激活函数,将实数范围压缩到0至1。Y为神经元的输出。
这里写图片描述

y=i=1n(wixiθ)(1)

f(x)=11+ex(2)

可以假设x0=1w0=θ。上式可以改写为y=f(wTx)

二、神经网络正向计算

目前提出的神经网络模型很多,但最常用的还是前馈神经网络。
神经网络

下面先定义描述神经网络的参数:
1. wl 第l层到第l+1层之间的权重矩阵,矩阵的维数为Nl+1×Nl
2. al 第l层的神经元的输出向量
3. zl 第l层神经元输入的加权和向量
4. x 神经网络的输入向量
5. y 神经网络的输出向量
6. L 神经网络的层数
7. Nl第l层神经元的数量
8. g(z) 神经元的激活函数

根据定义我们可以得到
zl=wTal
al+1=g(zl) 增加偏置 al+10=1
其中 a1=x,y=aL
根据上式不断迭代 计算出 即可得到神经网络的最终输出结果。

三、 误差逆传播算法

神经网络的损失函数为

J=12i=1NL(aLiyi)2(3)

学习神经网络就是要学习权重矩阵。可以根据梯度下降的优化方法求出权重矩阵的最优值。
wl=wlλJwl(4)

有因为zl+1i=wlial,所以
Jwlij=Jzl+1izl+1iwlij(5)

δl+1i=Jzl+1i,且zl+1iwlij=alj,即可得:

Jwlij=δl+1i×alj(6)

对于δli=Jzli 有两种情况
1. 当l=L,即为最后一层时

δLi=12NL+li=1(aLiyi)2zLi=(aLiyi)g(zLi)(7)

2. 当l为任意一层时
δli=Jzli=Jzl+1zl+1zli=j=1Nl+1Jzl+1jzl+1jzli=j=1Nl+1δl+1jzl+1jzli=j=1Nl+1δl+1jwljig(zli)=(wl)Tiδl+1g(zli)(8)

将(6)(7)(8)写成向量形式,最终得到BP神经网络的理论公式

Jwl=δl+1(al)T(9)

δL=(aLy).g(zl)(10)

δl=(wl)Tδl+1.g(zl)(11)
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值