神经网络参数的反向传播算法

本文介绍了神经网络的反向传播算法,从代价函数出发,详细阐述了如何将输出层的误差反向传播到隐藏层。通过前向传播算法和梯度检测来验证算法的正确性,并讨论了随机初始化参数的重要性以及神经网络架构的选择。同时指出,由于代价函数J(θ)的非凸性,梯度下降可能找到的是局部最优解。

代价函数
这里写图片描述
反向传播算法
将输出层的误差反向传播到前面的隐藏层
这里写图片描述
这里写图片描述
理解反向传播算法
前向传播算法:
这里写图片描述
这里写图片描述
这里写图片描述
梯度检测
通过计算代价函数梯度的估计值,检测是否与反向传播算法计算出来的梯度值相等或近似,从而判断反向传播算法的实现是否正确。
这里写图片描述
这里写图片描述
这里写图片描述
验证反向传播算法正确之后,要关掉梯度检测的代码
这里写图片描述
随机初始化
若将神经网络中的参数全初始化为0,那么在之后的梯度下降过程中,所有参数的变化都是相同的。这意味着最后的逻辑回归单元只会接收到一种特征。
这里写图片描述
这里写图片描述
神经网络的架构选择
这里写图片描述
训练神经网络的步骤
这里写图片描述
这里写图片描述
注意:反向传播算法中的代价函数J(θ)是一个非凸函数,使用梯度下降法或其他高级的优化算法得到的可能是局部最优值而不是全局最优值,但是一般两者相差不大。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值