论文总结:Estimating or Propagating Gradients Through Stochastic Neurons for Conditional Computation

本文探讨了在深度学习中,如何通过引入随机扰动来获得有效的梯度估计,以解决非平滑函数的梯度计算问题。提出了NoisyRectifier、STSUnits、Straight-Through Estimator等四种方案,并分析了各自的特性和应用。

论文地址:https://arxiv.org/pdf/1308.3432.pdf

主要内容

许多基于神经网络或深度学习的算法都是依赖于梯度的学习,为此需要平滑的网络来计算梯度,但这种想法并不正确。引入扰动可以获得估计的梯度。

像有限差分近似这种独立扰动计算低效,因此需要引入随机扰动。

那么好的梯度估计值是否可以进行计算和训练?

基于这一问题,作者讨论了四种方案:

  1. Noisy Rectifier
  2. STS Units: Stochastic Times Smooth
  3. Straight-Through EstimatorStraight-Through Estimator
  4. Conditional Computation Experiments

考虑神经元的输出hih_ihi
在这里插入图片描述
其中,hih_ihi是确定的函数。aia_iai是可微的变换,ziz_i<

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值