1 一元回归与多元回归
任何一本初级水平的计量经济学、统计学或机器学习相关书籍,都会详细推导多元线性线性回归的解,在这里就不再赘述。
我们给出本文用到的一些设定。yyy为NNN维因变量向量,假设y=Xβ+ϵy=X\beta+\epsilony=Xβ+ϵ,如果自变量为ppp维,将XXX排为N×(p+1)N\times (p+1)N×(p+1)矩阵,其中第一列x⋅0=1Nx_{\cdot 0}=1_Nx⋅0=1N为全是111的截距项,我们有最小二乘估计:
β^=(X′X)−1X′y \hat \beta = (X'X)^{-1}X'y β^=(X′X)−1X′y
如果是单变量回归,并且没有截距项的话,将自变量记为NNN维向量xxx,y=x′βy=x'\betay=x′β中β\betaβ的最小二乘估计为
β^=x′yx′x \hat\beta=\dfrac{x'y}{x'x} β^=x′xx′y
二者有何联系?如果在多变量回归中,XXX的列向量相互正交即X′XX'XX′X为对角矩阵,则可以得出,每个系数的估计值为β^j=x⋅j′yx⋅j′x⋅j\hat\beta_j=\dfrac{x_{\cdot j}'y}{x_{\cdot j}'x_{\cdot j}}β^j=x⋅j′x⋅jx⋅j′y。
这给了我们一种启示,能否构造出相互正交的一些维度?
2 Gram–Schmidt过程
我们用如下过程计算β^p\hat\beta_pβ^p:
- z⋅0=x⋅0=1Nz_{\cdot 0}=x_{\cdot 0}=1_Nz⋅0=