Andrew Ng网课笔记-Linear Regression(一)

最新推荐文章于 2022-03-12 14:21:07 发布

呵呵的校园

最新推荐文章于 2022-03-12 14:21:07 发布

阅读量316

点赞数

分类专栏：机器学习文章标签：算法机器学习概率论

本文链接：https://blog.youkuaiyun.com/u014628668/article/details/79441413

版权

11 篇文章

订阅专栏

本文通过房价预测实例介绍了线性回归的概念及其监督式学习方法，并详细解析了梯度下降算法的工作原理，用于求解代价函数的最小值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这一讲说到了线性回归（Linear Regression）

线性回归是一种监督式学习。我们给机器一些带标签的数据，然后机器用这些带标签的数据学习。

首先Ng老师举了个例子：

这是有关于房价预测的例子。

图中的点横坐标是面积，从纵坐标是房价，我们要做的事情是想找到一个模型，让这个模型更好的符合当前的房价与面积的对应关系，之后我们用这个模型简单的预测房价。

首先，我们有一些training set

我们用一些符号让我们之后的表述更清楚。

如果有4000条数据， m = 4000

x = [2104, 1416, 1534, 852 ... ]

y = [460, 232, 315, 178 ...]

(x^(i), y^(i))表示第i条数据

x^(i) = 2104, y^(i) = 460

第一步拿到训练集，之后选一种学习算法，学习出一个hypothesis，就是那个h, 个人觉得这个用模型来表示更好，只不过在机器学习最开始的时候用假说这个词，后面就一直这么叫了。当我们算出hypothesis 之后，输入一个x预测这个x对应的y值（不是真实的y值）。

我们假设这个假说是线性的， θ表示参数

我们要做的是找到合适的θ，让hθ(x) 距离真实的y值更接近

我们来简化一下cost function,来让我们更好的理解这个式子。

假如我们让hypothesis 函数中的参数中的θ0等于0的话， hθ(x)就由hθ(x)=θ0+θ1*x变成了hθ(x)=θ1*x

在几何中的意义呢就是直线过原点

比较一下hθ(x)和J(θ)

hθ(x)	J(θ1)
自变量是x，θ1是固定的说明这个函数是针对x来说	自变量是θ1，说明这个函数是针对θ1来说的

假如我们的数据为(1, 1)、(2, 2)、(3, 3)，如果我们的θ1取1的话直线方程如上图所示，斜率为1的过原点的直线	当θ1取1的时候，我们来算一下J(θ1)，结果是0所以在这个坐标系中一个点是(1, 0)

如果θ1等于0.5呢，我们将会得到一个新的图像，斜率是0.5过原点的直线	继续算θ1等于0.5时候的J(θ1) ≈ 0.58，所以第二个点是(0.5, 0.58)

再看一个，如果θ1等于0的话，图像是x轴	继续算θ1等于0时候的J(θ1) ≈ 0.23，所以第二个点是(0，0.23)，依次类推如果我们继续算θ1等于不同值时候的J(θ1)，我们能得到如下图所示的图像

	我们要求的是θ1取什么值的时候J(θ1)能到最小，从图像上可以看到，当θ1 等于1的时候J(θ1)有最小值，对应到左图也就是那条蓝线，确实是模型与真是数据最符合的时候，所以我们要求醉符合数据的模型就可以转换成求 J(θ1)的最小值

以上对hθ(x)和J(θ1)有了一个对比，相信大家对这两个方程有了更直观的认识，不过以上说的都是只有一个参数θ1的情况，我们之后要把两个参数都加上：

hθ(x)	J(θ0, θ1)
自变量是x，θ0, θ1是固定的, 说明这个函数是针对x来说	自变量是θ0, θ1，说明这个函数是针对θ0, θ1来说的

当θ0=50， θ1=0.06的时候，画出的线如图所示	当我们转到J(θ0, θ1)的时候，因为自变量变成了θ0和θ1，我们只能用一个三维图表示，为了之后表达方便，我们将三维图变成二维图，于是我们用‘等高线’表示，如下图所示：

θ0, θ1分别是800和-0.15的时候，画的线，过点(0, 800)，斜率是-0.15 我们可以看到，这条线与点的符合并不是很好。	这张图就是等高线的图，在同一条线上的点J(θ0, θ1)的值是相同的，所以如果我们在图上选中一点，他的坐标为(800, -0.15)，在左图看效果不好，在右图看该点距离椭圆的中心点距离也很远。

当θ0, θ1分别是350和0的时候，画的线，过点(0, 350)，斜率是0，直线与数据的符合程度比上一个图好一些。	换一个新的点(350, 0)，该点距离椭圆的中心点距离少了一些，相对应左图，直线与数据的符合程度好一些。

当θ0, θ1分别是200和0.12的时候，画的线，过点(0, 200)，斜率是 0.12，直线与数据符合程度最好。	当点取(200, 0.12)的时候，最接近椭圆的中心点，所以我们要做的就是找到椭圆的中心点。