深度学习中的优化算法（待更）

最新推荐文章于 2025-09-19 09:40:23 发布

原创最新推荐文章于 2025-09-19 09:40:23 发布 · 443 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

深度学习专栏收录该内容

5 篇文章

订阅专栏

本文探讨了如何通过优化算法提高神经网络的训练速度，特别是在大数据环境下。介绍了Mini-batch梯度下降算法，解释了其在处理大规模数据集时的优势，以及如何在实际应用中确定最佳的mini-batch大小。

优化算法可以使得神经网络运行的速度大大加快，机器学习的应用是一个高度依赖经验的过程，伴随着大量迭代的过程，需要训练诸多的模型来找到最合适的那一个。其中的一个难点在于，深度学习没有在大数据领域发挥最大的效果，我们可以利用一个巨大的数据集来训练神经网络，而大数据下其训练的速度非常慢，此时通过好用的优化算法就可以大大提高团队的效率。

1、Mini-batch梯度下降

在训练过程中，把训练集分割为小一点的子集进行训练，这些子集被称为mini-batch，x(i)表示第i个训练样本，z(L)表示神经网络中第L层的z值，X{t}表示第t个mini-batch。这样在实际训练过程中，每次可以同时处理单个的X{t}和Y{t}，而不用同时处理全部的X和Y训练集。

当mini-batch大小设置为m时可以得到batch算法，设置为1时即为随机梯度下降算法。Batch梯度下降从某处开始，相对噪声低一些，幅度也大一些，可以继续寻找最小值。随机梯度下降噪声相对较大，平均来看，它最终会靠近最小值，不过有时候也会方向错误，因为随机梯度下降永远不会收敛，而是一直会在最小值附近波动，但它并不会达到最小值并停留在此。

mini-batch大小的确定原则：

如果训练集小于2000个样本，直接进行batch梯度下降，没必要使用mini-batch；
使用mini-batch要确保X{t}和Y{t}符合CPU/GPU。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。