关于训练深度最难的事情之一是你要处理的参数的数量,从学习速率?到 Momentum
(动量梯度下降法)的参数?。如果使用 Momentum 或 Adam 优化算法的参数,?1,?2和?,
也许你还得选择层数,也许你还得选择不同层中隐藏单元的数量,也许你还想使用学习率衰
减。所以,你使用的不是单一的学习率?。接着,当然你可能还需要选择 mini-batch 的大小
————————————————
版权声明:本文为优快云博主「数据科学家修炼之道」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.youkuaiyun.com/xiligey1/article/details/100190828
深度学习系列
最新推荐文章于 2021-03-10 00:00:00 发布