在卖房子这个例子中,我们用到的是线性回归模型。
首先介绍几个概念,训练集,即我们提供的由于房子大小及对应价格的一组数据集。在训练集中,我们用m表示训练样本的数量,x表示输入变量,y表示输出变量,(x, y)表述一个训练样本,(x^(i), y^(i))中的i表示第i个训练样本。
有了这些值,我们就可以建立一个算法模型:
其中h表示从x到y的一个映射。从最简单的开始,我们将h定义为一个线性回归模型,即h(x) = θ0 + θ1 * x,我们所要做的,就是确定θ0和θ1的值,使得得到的直线与训练集尽量拟合。
这里就要定义一个函数——代价函数(Cost Function)。
首先目的最简单,使得(h(x)-y)最小,或者(h(x)-y)^2最小,进一步,数据集的总和最小——>也可以写成
到这里,就可以定义出这个问题的代价函数了——
其中,又有h(x) = θ0 + θ1 * x,我们想要做的,就是关于θ0和θ1对函数J(θ0, θ1)求最小值。
本文通过一个房价预测的实际案例介绍了线性回归的基本原理。文章详细解释了如何使用训练集来确定线性回归模型参数,并通过定义代价函数来评估模型的准确性。

1146

被折叠的 条评论
为什么被折叠?



