线性回归(Linear regression)是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。其实,还有梯度下降法、坐标轴下降法、最小角回归法等。
1.线性回归函数
线性回归遇到的问题一般是这样的。我们有m个样本,每个样本对应于n维特征和一个结果输出,如下:
我们的问题是,对于一个新的 他所对应的
是多少呢? 如果这个问题里面的y是连续的,则是一个回归问题,否则是一个分类问题。
对于n维特征的样本数据,如果我们决定使用线性回归,那么对应的模型是这样的:
其中
为模型参数,
为每个样本的n个特征值。这个表示可以简化,我们增加一个特征
,这样
。
进一步用矩阵形式表达更加简洁如下:
其中, 假设函数