注意:原图上错误的地方,global_step/LRARNING_RATE_BATCH_SIZE 这一项为前面的LEARNING_RATE_DECAY的指数,而不是和其的乘积。

本文纠正了一个关于学习率衰减公式中常见的误解,明确指出 global_step 在 LEARNING_RATE_DECAY 中作为指数而非乘数的角色。
注意:原图上错误的地方,global_step/LRARNING_RATE_BATCH_SIZE 这一项为前面的LEARNING_RATE_DECAY的指数,而不是和其的乘积。


被折叠的 条评论
为什么被折叠?