49、线性模型选择与诊断全解析

线性模型选择与诊断全解析

1. 简单线性模型的初步分析

在分析数据时,我们首先关注到左上角的图展示了数据以及简单线性模型的直线。该直线清晰地捕捉到了数据的上升趋势,但同时也暗示数据可能存在一定的曲率。通过诊断残差与拟合值的图(右上角),我们发现仅考虑线性趋势的模型并不充分,其呈现的系统性模式对线性模型误差的假设提出了质疑。

而底部的图展示了基于二次模型的残差与拟合值的关系。在“高度”变量中加入二次项后,残差中的明显曲线得到了消除。不过,最新的残差 (e_i) 仍呈现出类似波浪的系统性行为,这或许提示我们尝试使用三次模型,但由于样本量较小,实现起来存在一定困难。

2. 评估误差的正态性

为了评估误差是否服从正态分布,我们可以使用正态 QQ 图。在 R 语言中,对 lm 对象调用 plot 函数并设置 which = 2 ,就能生成标准化残差的正态分位数 - 分位数图。以 car.step 模型为例,输入以下代码:

plot(car.step, which = 2)

我们按照之前的方法解读残差的 QQ 图。灰色对角线代表真实的正态分位数,绘制的点则是估计回归误差的相应数值分位数。若数据服从正态分布,这些点应接近直线。对于 car.step 回归模型,点大致遵循理论正态分位数的路径,虽有一定偏差,但无明显的非正态迹象。

除了 QQ 图,我们还可以使用著名的 Shapiro - Wilk

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值