本文目录
线性回归模型是一种确定变量之间的相关关系的一种数学回归模型。一般用来处理变量之间满足一定线性关系的问题
一、经典的线性回归
1.简单介绍
其基本公式为 Y i ^ = β 0 + β 1 X i 1 + β 2 X i 2 + . . . + β p X i p , i = 1 , . . . , n \hat{Y_i}=\beta_0+\beta_1X_{i1}+\beta_2X_{i2}+...+\beta_pX_{ip},\quad\quad i=1,...,n Yi^=β0+β1Xi1+β2Xi2+...+βpXip,i=1,...,n
矩阵表达形式为: Y ^ = β T X \hat Y=\beta^TX Y^=βTX
其中 Y ^ \hat Y Y^是所有数据的预测标签,为一个列向量
Y ^ = ( Y ^ 1 Y ^ 2 . . . Y ^ n ) \hat Y = \left( {\begin{array}{cc} \hat Y_1 \\ \hat Y_2 \\ .\\ .\\ .\\ \hat Y_n \end{array} } \right) Y^=⎝⎜⎜⎜⎜⎜⎜⎛Y^1Y^2...Y^n⎠⎟⎟⎟⎟⎟⎟⎞
β \beta β是所有参数值构成的列向量
β = ( β 0 β 1 . . . β p ) \beta = \left( {\begin{array}{cc} \beta_0 \\ \beta_1 \\ .\\ .\\ .\\ \beta_p \end{array} } \right) β=⎝⎜⎜⎜⎜⎜⎜⎛β0β1...βp⎠⎟⎟⎟⎟⎟⎟⎞
X X X是 n ⋅ p n\cdot p n⋅p的矩阵,其中 n n n为当前样本的数据量, p p p为参数的个数(其第一列元素全为1,做矩阵运算时用来与 β 0 \beta_0 β0相乘)
X = ( 1 x 11 ⋯ a 1 p 1 x 21 ⋯ a 2 p ⋮ ⋮ ⋱ ⋮ 1 x n 1 ⋯ a n p ) X = \left( {\begin{array}{cccc} 1 & x_{11} & \cdots & a_{1p}\\ 1 & x_{21} & \cdots & a_{2p}\\ \vdots & \vdots & \ddots & \vdots\\ 1 & x_{n1} & \cdots & a_{np}\\ \end{array} } \right) X=⎝⎜⎜⎜⎛11⋮1x11x21⋮xn1⋯⋯⋱⋯a1pa2p⋮anp⎠⎟⎟⎟⎞
2.损失函数
这里我们可以采用平方损失函数来表示预测值与真实值之间的误差:
L ( β ) = ∣ ∣ Y ^ − Y ∣ ∣ 2 = ∣ ∣ β T X − Y ∣ ∣ 2 = ( β T X − Y ) T ( β T X − Y ) \begin{aligned}L(\beta)&=||\hat Y-Y||^2\\&=||\beta^TX-Y||^2\\&=(\beta^TX-Y)^T(\beta^TX-Y)\end{aligned} L(β)=∣∣Y^−Y∣∣2=∣∣βTX−Y∣∣2=(βTX−Y)T(βTX−Y)
3.参数优化
最小二乘法
很显然该损失函数是一个关于 β \beta β的凸函数,因此我们可以采用最小二乘法求解其解析解(即另其对 β \beta β的导数为0),求解可得:
β = ( X T X ) − 1 X T Y \beta=(X^TX)^{-1}X^TY β=(XTX)−1XTY
这里对求解过程感兴趣的可以看一下我的另一篇博客,其中有具体的推导过程ALS算法理解
梯度下降
同时我们可以采用梯度下降的方式进行参数优化,首先我们可以计算出某一点的梯度:
L ( β ) = ∣ ∣ Y ^ − Y ∣ ∣ 2 = ∣ ∣ β T X − Y ∣ ∣ 2 = ( β T X − Y ) T ( β T X − Y ) \begin{aligned}L(\beta)&=||\hat Y-Y||^2\\&=||\beta^TX-Y||^2\\&=(\beta^TX-Y)^T(\beta^TX-Y)\end{aligned} L(β)=∣∣Y^−Y∣∣2=∣∣βTX−Y∣∣2=(βTX−Y)T(βTX−Y)
∂ L ( β ) ∂ β = ( β T X − Y ) X \frac{\partial L(\beta)}{\partial \beta}=(\beta^TX-Y)X ∂β∂L(β)=(βT

本文详细介绍了线性回归,包括基本公式、损失函数、参数优化和多角度理解,如概率和几何角度。接着讨论了带正则项的线性回归,如Lasso、Ridge和Elastic Net,分析了它们的特点和应用场景。最后探讨了多项式回归和带核函数的线性回归,强调了选择合适映射维度的重要性。
最低0.47元/天 解锁文章
4714





