一、检验构建的方程模型方法:
R^2, AIC, BIC
二、残差图Residual plots可以检验回归的结果:
当残差满足高斯分布式,就有最小二乘线性回归等价于极大似然估计。
三、error terms 误差不相关,模型较好
当error terms相关时,则估计的标准差会低估真实标准差standard errors,即真实的标准差更大。置信度和预测值的范围会变窄,即没有那么可信,这可能会导致引入不那么重要的变量(估计的可信度偏高)。
当样本有重复值时,统计显著性会相对于去除重复值更不显著。
有时会出现在时间序列上,当在连续的时间上取值时,error terms更可能相关。
当因变量经过同样的处理,或者自相关,或因变量经过处理,预测自己时,error terms更容易相关。
四、减少non-constant variances (异方差性heteroscedasticity),做log,或开根号
残差恒定是线性回归建模的一个前提条件,《线性回归中的方差齐性探察》一文曾介绍过各种线性回归的方差齐性的检验方法。如果出现了异方差,数据变换、方差稳健估计(使用三明治方差估计量)、加权最小二乘法回归、非参数回归都是可以考虑的方法。此次笔记介绍加权最小二乘法(weighted least square,WLS)回归。
加权线性回归(加权最小二乘法回归)
《An Introduction to Statistical Learning with Applications in R(Gareth James, Trevor Hastie, Daniela Witten)
》