线性回归原理
一元线性回归
一元线性回归其实就是从一堆训练集中去算出一条直线,使数据集到直线之间的距离差最小。
举个栗子:
唯一特征X,共有m = 500个数据数量,Y是实际结果,要从中找到一条直线,使数据集到直线之间的距离差最小,如下图所示:
那要如何去完成这个操作呢?
线性回归所提供的思路是,先假设一条直线:
可以将特征X中每一个值都带入其中,得到对应的
,定义可以将损失定义为
和
之间的差值平方的和:
一元线性回归其实就是从一堆训练集中去算出一条直线,使数据集到直线之间的距离差最小。
举个栗子:
唯一特征X,共有m = 500个数据数量,Y是实际结果,要从中找到一条直线,使数据集到直线之间的距离差最小,如下图所示:
那要如何去完成这个操作呢?
线性回归所提供的思路是,先假设一条直线:
可以将特征X中每一个值都带入其中,得到对应的
,定义可以将损失定义为
和
之间的差值平方的和: