近来,在网易云课堂观看了吴恩达机器学习的视频,写下该系列博客让自己在未来能够观看复习知识。
如上图所示,这是一幅关于房子尺寸与房子的价格之间关系的散点图,假如你有一位朋友想要出售他的房子,那么你就可以根据这些数据来为你的朋友评估他的房子的价格。现在观察图像,我们似乎能够在这张图上画出一条倾斜的直线来拟合这些点,如下图:
通过这条直线,我们就可以来根据你朋友房子的尺寸来估计他房子的价格,但问题来了?你可以清楚知道,在这张图片上,我们可以画出很多条直线,那么哪一条直线才是最拟合这些数据点的呢?这就是机器学习将要解决的问题。
如上图,图为一些房子的尺寸x与对应的房子价格y的数据,我们设所要得到的直线为上图的h(x)函数,该函数中的和
就是我们所要求出的参数,该模型因为只有一个变量x,所以我们称为“单变量回归模型”。那么如何求解出最佳的两个参数呢?这时候我们就要利用上面说的数据集通过某些算法来训练我们的函数(在实践中,我们会通常把数据集分为两部分:训练集和测试集,训练集用来训练函数得到合社参数,再利用测试集来评估我们的函数性能),从而得到适合的参数。
如上图所示,现在我们有一个假设的线性函数h(x),现在要做的就是求出该函数的两个参数和
,我们设一个关于这两个函数的函数J(
,
),看上图,J(
,