前言
回归模型对数据的拟合性怎么样,有没有异常点,各自变量间存不存在多重共线?
本文进行拟合优度的评估、异常点(离群值、高杠杆值、强影响点)的识别与多重共线的诊断。
模型评估与诊断
(1)模型拟合优度评估
在模型拟合完毕通过summary()函数可以获得参数估计表,同时函数也给出了模型的决定系数、校正的决定系数。本例多重线性回归模型的决定系数R^2=0.2352,即结局变量的总变异中可由回归模型中解释变量解释的部分仅占23.52%。
除了决定系数、校正的决定系数外,赤池信息准则(AIC)、残差均方(MSE)、Cp统计量也是模型优劣的标准。
library(olsrr)
ols_aic(lmfit)
full_model<-lm(bwt~.,data=lmdata) #表示包含除因变量外的所有变量。例如,若一个数据框包含变量 x、y、z 和 w,代码 y ~ .可展开为 y ~x + z + w
ols_sbic(lmfit, full_model)
函数ols_plot_diagnostics{ol