结论源自:google 论文《AN EMPIRICAL STUDY OF LEARNING RATES IN DEEP NEURAL NETWORKS FORSPEECH RECOGNITION 》
该基于与现有所有 learning rate schedulding schemes 对比提出 “AdaDec”
1. 目前,最有效的 随机梯度下降算法是:minibatch stochastic gradient descent
2. 论文中提出的 “AdaDec” 是 learning rate schedulding schemes 中最优的。
本文总结了google论文《ANEMPIRICALSTUDYOFLEARNINGRATESINDEEPNEURALNETWORKSFORSPEECHRECOGNITION》,介绍了最有效的随机梯度下降算法minibatchstochasticgradientdescent,并提出了最优的学习率调度方案AdaDec。
2561

被折叠的 条评论
为什么被折叠?



