13、线性回归分析与数据分类:从基础到应用

线性回归分析与数据分类:从基础到应用

线性回归分析

回归模型评估指标

在进行线性回归分析时,有几个关键的评估指标值得关注。例如,F统计量的p值显著,说明模型整体是有意义的。同时,多重R平方(Multiple R - squared)表示模型能够解释的因变量方差比例,这里是 55%。调整后的R平方(Adjusted R - squared)则考虑了模型中预测变量的数量,通常会比多重R平方略低。在本次分析中,调整后的R平方只是略低于多重R平方,这意味着预测变量的数量对结果影响不大。

残差正态性检验

残差的正态分布对于线性回归模型很重要。可以通过绘制直方图直观地检查残差的分布情况,代码如下:

hist(resid(model1), main="Histogram of residuals", 
   xlab="Residuals")

从直方图的输出结果,我们可能会怀疑残差有轻微的偏离正态分布。为了进一步验证这个怀疑,可以使用Shapiro - Wilk检验,代码为:

shapiro.test(resid(model1))

输出结果显示,残差并没有显著偏离正态分布(W = 0.9776, p - value = 0.6001)。此外,还可以通过Q - Q图进行检查,输入 plot(model1) 并在RGraphics窗口中点击直到出现合适的图。不过,就像之前的鸢尾花数据集示例一样,某些观测值可能会存在问题。 <

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值