机器学习:从梯度下降到模式检测
1. 梯度下降与成本最小化
1.1 参数 lambda 的调整
在机器学习中,惩罚项前的参数 lambda 起着重要作用。它可被视为一种权重,决定了正则化惩罚在成本函数中的比重。为了确定最佳的正则化水平,需要手动调整该参数。具体做法是尝试不同的 lambda 值,然后选择在验证集上误差最小的值。
1.2 梯度下降算法
梯度下降算法是一种通用的方法,用于寻找使函数值最小化的参数。它通过迭代地沿着梯度(即从当前状态下降最快的方向)调整参数来实现。虽然梯度下降算法一开始可能因涉及大量微积分知识而让人望而生畏,但一旦克服了最初的障碍,它其实是一个相当简单的算法。而且,它适用于广泛的情况,只要函数存在最小值、可微且不是过于病态,就可以使用该算法。对于大多数机器学习问题,当我们试图找到最适合数据集的模型时,实际上是在最小化某种距离或成本函数,梯度下降很可能会帮助我们找到这个模型。
1.3 随机梯度下降和批量梯度下降
梯度下降算法有两种变体:随机梯度下降和批量梯度下降,它们各有优缺点。
| 算法类型 | 优点 | 缺点 |
| ---- | ---- | ---- |
| 随机梯度下降 | 每次只更新一个观测值的参数,不需要一次性处理整个数据集,适合在线学习。如果数据集随时间不断扩展,可以使用最新的数据点更新估计值,逐步学习。 | 相对较慢,稳定性可能较差。虽然算法总体上朝着正确的方向前进,但每个单独的步骤不一定能带来改进。 |
| 批量梯度下降 | 一次性处理整个数据集,每一步都能产生一个改进的模型。 | 每一步的计算量更大,特别是在数据集较大时,使
机器学习:梯度下降与模式检测
超级会员免费看
订阅专栏 解锁全文
1024

被折叠的 条评论
为什么被折叠?



