线性回归是⼀种⽤于建⽴输⼊变量(特征)与连续⽬标变量之间关系的线性模型。它是机器学习和统计学中最简单、最常⻅的回归⽅法之⼀。线性回归假设特征与⽬标之间存在线性关系,并试图找到⼀条最佳拟合的直线(或超平⾯)来描述数据之间的关系。
在机器学习领域中的大多数任务通常都与预测(prediction)有关。 当我们想预测一个数值时,就会涉及到回归问题。 常见的例子包括:预测价格(房屋、股票等)、预测住院时间(针对住院病人等)、 预测需求(零售销量等), 但不是所有的预测都是回归问题。
1.基本原理
线性回归基于以下基本原理:
- 线性关系假设:假设⽬标变量与特征之间存在线性关系。
- 最⼩化误差:通过最⼩化实际观测值与模型预测值之间的误差来确定最佳拟合直线。