gradient descent 梯度下降算法

最新推荐文章于 2024-08-24 10:56:49 发布

原创

最新推荐文章于 2024-08-24 10:56:49 发布 · 置顶 · 1.3w 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#machine learning #神经网络 #算法 #优化 #预测

本文深入探讨了机器学习中不可或缺的梯度下降算法，解释了它如何作为优化工具用于最小化目标函数。通过身高体重数据的示例，介绍了线性函数的误差计算与成本函数的构建。文章还阐述了梯度的概念及其在寻找成本函数最小值中的应用，以及学习率在参数更新中的重要性，最终目标是得到最优化的模型参数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天给大家介绍一个machine learning中非常基础又非常重要的算法：gradient descent 梯度下降算法。其实在写这篇文章之前，我前面的文章中就有提到gradient descent，它实在是太“泛滥”了，几乎到处都能看到它的身影。那么，它到底是什么？能干什么？它是一种优化算法，在machine learning中经常用来优化目标函数，那什么是目标函数？目标函数根据问题的不同而不同，大家可以看我的另外两篇文章，里面就用到在gradient descent优化目标函数，大家可以看看里面的目标函数是什么，这两篇文章是BP神经网络和推荐系统之矩阵分解。

这里就给大家举个稍微简单一点的例子，假设有一堆男生女生的身高体重数据（training set），假是一条是身高体重数据，x1是身高，x2是体重，y是类标号，y=1表示这条数据是男生的，y=-1表示这条数据是女生的。我们希望能学习出一个函数f(X)，使得f(X)能够尽可能准确地描述这些数据，如果能求出这个f(X)，那么任给一个身高体重，就能预测出这人是男生还是女生。