论文地址:https://arxiv.org/pdf/1308.3432.pdf
主要内容
许多基于神经网络或深度学习的算法都是依赖于梯度的学习,为此需要平滑的网络来计算梯度,但这种想法并不正确。引入扰动可以获得估计的梯度。
像有限差分近似这种独立扰动计算低效,因此需要引入随机扰动。
那么好的梯度估计值是否可以进行计算和训练?
基于这一问题,作者讨论了四种方案:
- Noisy Rectifier
- STS Units: Stochastic Times Smooth
- Straight-Through EstimatorStraight-Through Estimator
- Conditional Computation Experiments
考虑神经元的输出hih_ihi:

其中,hih_ihi是确定的函数。aia_iai是可微的变换,ziz_i<

本文探讨了在深度学习中,如何通过引入随机扰动来获得有效的梯度估计,以解决非平滑函数的梯度计算问题。提出了NoisyRectifier、STSUnits、Straight-Through Estimator等四种方案,并分析了各自的特性和应用。
最低0.47元/天 解锁文章
1191

被折叠的 条评论
为什么被折叠?



