机器学习笔记之简化成本函数和梯度下降

最新推荐文章于 2025-05-28 14:28:31 发布

water2bear

最新推荐文章于 2025-05-28 14:28:31 发布

阅读量880

点赞数 1

本文介绍了一种简化版的成本函数及其在梯度下降算法中的应用。通过将两个条件情况压缩为一个统一公式，简化了逻辑回归的成本函数。此外，还详细介绍了梯度下降算法的实现方式，包括其向量化版本。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Simplified Cost Function and Gradient Descent

Note: [6:53 - the gradient descent equation should have a 1/m factor]

We can compress our cost function's two conditional cases into one case:

Cost(hθ(x),y)=−ylog(hθ(x))−(1−y)log(1−hθ(x))

Notice that when y is equal to 1, then the second term (1−y)log(1−hθ(x)) will be zero and will not affect the result. If y is equal to 0, then the first term −ylog(hθ(x)) will be zero and will not affect the result.

We can fully write out our entire cost function as follows:

J(θ)=−1m∑i=1m[y(i)log(hθ(x(i)))+(1−y(i))log(1−hθ(x(i)))]

A vectorized implementation is:

h=g(Xθ)J(θ)=1m⋅(−yTlog(h)−(1−y)Tlog(1−h))

Gradient Descent

Remember that the general form of gradient descent is:

Repeat{θj:=θj−α∂∂θjJ(θ)}

We can work out the derivative part using calculus to get:

Repeat{θj:=θj−αm∑i=1m(hθ(x(i))−y(i))x(i)j}

Notice that this algorithm is identical to the one we used in linear regression. We still have to simultaneously update all values in theta.

A vectorized implementation is:

θ:=θ−αmXT(g(Xθ)−y⃗ )

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

water2bear

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

机器学习----成本函数

m0_58625397的博客

02-26

1262

代价函数

【机器学习】模型和成本函数

椰卤工程师的个人博客

12-02

1175

模型表示为了稍微更正式地描述监督学习问题，我们的目标是在给定训练集的情况下，学习函数 h : X → Y，以便 h(x) 是对应 y 值的“好”预测器。由于历史原因，这个函数 h 被称为假设。从图片上看，这个过程是这样的：当我们试图预测的目标变量是连续的时候，例如在我们的住房示例中，我们将学习问题称为回归问题，当 y 只能采用少量离散值时候，例如，如果在给定居住面积的情况下，我们想要预测住宅是房屋还是公寓，我们将其称为分类问题。成本函数我们可以使用成本函数来衡量假设函数的准确性。这需要假设的所有结

参与评论您还未登录，请先登录后发表或查看评论

梯度下降算法_机器学习中的成本函数，学习率和梯度下降

weixin_39540934的博客

11-18

759

成本函数我们在机器学习中最主要的目标是最小化成本函数，因此，将执行优化过程以最小化该成本函数。成本函数由下式给出：为了深入了解成本函数的几何形状，让我们学习凹函数和凸函数：凹函数在凹函数g(x)中，对于x轴上的任意两个值，即a和b，点g(a)和g(b)之间的直线总是位于g(x)的下方。凹函数的最大值是一个导数为0的点凸函数凸函数具有相反的属性，凸函数的最小值是导数为0的点。我们如何找到成本函数的最...

机器学习——损失函数，成本函数

最新发布

shan_gui123的博客

05-28

731

是所有样本损失函数的汇总（通常是平均值），同时可能包含正则化项。，衡量模型对样本的预测结果与真实标签之间的误差。目的是为了量化模型在。上表现得有多“差”。目的是为了衡量模型在。

机器学习__成本函数

kaige8312的博客

09-22

340

是衡量与训练样本符合程度的指标.与的误差的平均值成本函数就是与的模型训练的过程就是: 合适的, 使得成本函数的值最小.

6 - 5 - Simplified Cost Function and Gradient Descent (10 min)

zzq123686的专栏

07-28

393

机器学习笔记之优化算法(十二)梯度下降法：凸函数VS强凸函数

静静的学习就好

08-09

2868

本节将介绍凸函数/严格凸函数/强凸函数以及它们之间的联系(补梯度下降法：总体介绍中的坑)。

机器学习笔记02-代价函数与梯度下降算法（一）

耿国锋的博客

03-22

4597

在阅读这篇博文之前你需要了解的数学知识： 1，误差：本篇用平方差误差公式。 2，函数的收敛性：当函数趋向无穷大或无穷小，或某个具体数值时，该函数总是逼近某个值，这就是函数的收敛性。 3，导数：导数的数学意义就是这个点的斜率。 4，矩阵。一，模型表示我们的第一个学习算法是线性回归算法。这篇博文你将会使你了解监督学习过程完整的流程。让我们通过一个例子来开始：这个例

机器学习笔记之配分函数(一)对数似然梯度

静静的学习就好

12-05

1997

从本节开始，将介绍配分函数。[花书第三部分——第18章直面配分函数(Confronting Partition Function)]

机器学习——线性回归算法、代价函数、梯度下降算法基础

什么时候才不是菜鸟....

02-20

1290

线性回归算法、代价函数、梯度下降算法

机器学习笔记之优化算法(十六)梯度下降法在强凸函数上的收敛性证明

静静的学习就好

08-20

2648

本节将介绍：梯度下降法在强凸函数上的收敛性，以及证明过程。

【机器学习】从线性回归模型看一个简单的成本函数

2302_76305195的博客

03-10

1354

为了构建一个不会随着训练集大小而自动变大的成本函数，我们将计算平均平方误差而不是总平均误差，我们采用对每一个训练示例的误差求和再平均。但是如上，这样的误差可能是正、也可能是负，在数学中，衡量整体而非单个的误差，我们都要计算误差的绝对值或者平方(一般都是平方)。这条直线，在视觉上，我们看起来是相符的，但是这粗略的判断或者大概的估计，是不严谨的，我们并不能通过“视觉观察”来寻求。而对于我们的数据集，和我们定下的线性回归模型，我们需要选择。的值，以便我们的得到的函数f可以更好地拟合我们的数据。

【机器学习】成本函数在逻辑回归中的形式以及逻辑回归的成本函数

ya的博客

08-02

1795

检查并使用逻辑回归的成本函数

【吴恩达机器学习笔记】第1周 - 线性回归与代价/成本函数

Sun_Weiss的博客

10-26

612

机器学习的模式：用训练集的数据，匹配一种算法，生成一个函数（h），这个函数可以输入x，产出y 所以机器学习的关键在于： 1、选择正确的算法，选择算法之后，函数h的形态就确定了，但是参数未知 2、确定函数h的参数值：监督学习：通过训练集的x和y，共同确定参数值无监督学习：通过训练集的x，确定参数值最简单的算法：一元线性回归(Linear Regression）相同的算法，不同的参数值：成本函数（Cost Function...

梯度下降（gradient descent）

iterate7的博客

08-05

2647

梯度在某个点的位置法向量,所以它的方向表示下降最快或者上升最快也就很好理解了。法向量：假设平面a与向量n垂直，且n是非零向量，那么n就是a的法向量。由于是垂直的关系，针对当前点而言，肯定是变化最快的方向。梯度是一个方向，而且是针对某个点（其实是这个点对应的切面）这个方法变化率最快，用偏导来表达∇=(∂f∂x,∂f∂y,∂f∂z)(1)\nabla= (\frac{

简化成本函数和梯度下降

weixin_30518397的博客

07-23

173

我们可以将成本函数的两个条件情形压缩为一个情形：注意到当y=1，那么=0也就是说没有效果。当y=0，那么=0。我们可以完全写出我们的全部成本函数如下：矢量化实现： 梯度下降 请记住，梯度下降的一般形式是：利用微积分可以求出导数的部分：注意，这个算法与我们在线性回归中使用的算法是一样的。我们仍然必须同时更新θ中的所有值矢量...

损失函数、成本函数cost 、最大似然估计、有无监督

weixin_39354845的博客

08-30

1512

深度学习中的基础数学

orange实现逻辑回归_机器学习笔记（三）逻辑回归

weixin_42364174的博客

01-17

905

Classification(分类)1、问题背景：特殊的样本点会使得分界点发生漂移，影响准确性。Hypothesis representation(假设函数表达式)1、Logistic regression Model(逻辑回归模型)：(1)Sigmoid function / Logistic function S型函数/逻辑函数：(2)g(z)图像：(3)hθ(x) 表示在给定参数θ对于某个特...

从西方经济学的角度分析，努力成本

m0_46168848的博客

09-01

298

努力成本个人定义：在某种经济周期情况下，达成某种目标所需要花费的时间成本、脑力成本、体力成本，以及生活成本，其中包括量化的经济周期成本，经济周期包括市场容量，人才技术，行业饱和状况，经济总体发展情况等量化指标；在不同阶段，达成相同的目标所需要付出的成本是不一样的。公式：努力的成本= [（脑力成本+生活成本） + 经济周期成本 + 机会成本 ] * 内卷系数 + 时间成本举例说名：在不同的经济周期下，不同的阶段达成同一目标的价值不一样，付出的努力不一样！比如：二十年前，互联网兴起的时期，做电商，