batch size和梯度下降的movement向量

inf-inf

已于 2022-10-17 13:07:58 修改

阅读量114

点赞数

分类专栏： Notebook 李宏毅机器学习 python 文章标签：深度学习机器学习

于 2022-10-17 13:06:38 首次发布

原文链接：http://speech.ee.ntu.edu.tw/~tlkagk/courses.html https://b23.tv/tCUNobS

版权

Notebook 同时被 3 个专栏收录

49 篇文章

订阅专栏

32 篇文章

订阅专栏

李宏毅机器学习

21 篇文章

订阅专栏

在这里插入图片描述

一次epoch里被iteration分，分的大小batch size，一个iteration的batch size个数据来训练，更新loss更新参数，在每个epoch后shuffle，batches改变，即每个iteration的batch size数据改变；
在并行计算时，大的batch size训练时间不一定比较长；
因为大的batch size更新参数少；
大的batch size训练效果可能不好；
一次梯度下降的movement向量，是上一次移动的向量+这一次gradient的负反向量；或者解释说，一次梯度下降的movement向量，是过去所有gradient的总和+这一次gradient的负反向量；

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。