caffe 更新权重的理解

1.caffe 在做train时,每一步Step当中,要做iter_size次forward_backward迭代计算,其中每一次foward_backward计算都会产生权重的残差diff,那么做iter_size次forward_backward计算就会产生iter_size次diff残差,SGDSolver会把这iter_size个diff残差做一个平均计算,取其平均值作为本次Step的权值diff,计算均值的过程是在函数Normalize(int   param_id) 函数中进行的,在Normalize(int   param_id) 函数之后,紧接着时Regularize(int   param_id )函数,该函数的作用是根据求解器描述文件中事先指定的weight_decay参数,以及net网路描述文件中每层layer中指定的weight_decay参数(可选,默认不指定)对  均值diff进行微调,当net中的某一层没有指定weight_decay参数时,其weight_decay默认值会为0, 结果是该层的均值diff不会被进行任何微调。微调(可选)后的diff再乘以本层的lr学习率,得到的diff就是本次Step最终用来更新本层weight的值。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值