有时候在某些 hyperparameter.设定下model train得收敛了,但是其实更改hyperparameter.,可以收敛到一个更好的status,
比如batch size,最开始因为选的比较小,最后在optimal的位置来回震荡,这时候增大batch size或者调低lr说不定可以收敛到一个更好的status
有时候在某些 hyperparameter.设定下model train得收敛了,但是其实更改hyperparameter.,可以收敛到一个更好的status,
比如batch size,最开始因为选的比较小,最后在optimal的位置来回震荡,这时候增大batch size或者调低lr说不定可以收敛到一个更好的status