线性回归分析与数据分类:从基础到应用
线性回归分析
回归模型评估指标
在进行线性回归分析时,有几个关键的评估指标值得关注。例如,F统计量的p值显著,说明模型整体是有意义的。同时,多重R平方(Multiple R - squared)表示模型能够解释的因变量方差比例,这里是 55%。调整后的R平方(Adjusted R - squared)则考虑了模型中预测变量的数量,通常会比多重R平方略低。在本次分析中,调整后的R平方只是略低于多重R平方,这意味着预测变量的数量对结果影响不大。
残差正态性检验
残差的正态分布对于线性回归模型很重要。可以通过绘制直方图直观地检查残差的分布情况,代码如下:
hist(resid(model1), main="Histogram of residuals",
xlab="Residuals")
从直方图的输出结果,我们可能会怀疑残差有轻微的偏离正态分布。为了进一步验证这个怀疑,可以使用Shapiro - Wilk检验,代码为:
shapiro.test(resid(model1))
输出结果显示,残差并没有显著偏离正态分布(W = 0.9776, p - value = 0.6001)。此外,还可以通过Q - Q图进行检查,输入 plot(model1) 并在RGraphics窗口中点击直到出现合适的图。不过,就像之前的鸢尾花数据集示例一样,某些观测值可能会存在问题。 <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



