14、线性模型的数据处理与分析

线性模型的数据处理与分析

1. 正态 Q-Q 图与残差分析

正态 Q-Q 图是一种用于检验数据是否服从正态分布的工具。即使数据真正服从正态分布,正态 Q-Q 图的两端也可能会有一些小波动。不同类型的数据在 Q-Q 图上会有不同的表现,例如右偏态数据、左偏态数据以及尾部比正态分布更厚的数据。需要注意的是,正态 Q-Q 图是一种大样本技术,在数据量较小时相对不敏感。不过,线性模型对偏离正态分布具有一定的稳健性,所以一般无需过度担忧。有时,将自己数据的正态 Q-Q 图与从正态分布中抽取相同大小样本创建的五六个其他 Q-Q 图进行比较,有助于理解图中的变异性。

在实际分析中,可以为残差创建直方图和正态 Q-Q 图。以某个例子来说,根据这些图没有理由怀疑正态性假设。

2. 零截距模型

在很多情况下,我们可能会想拟合一个没有截距的模型,即零截距模型或过原点的回归。这是因为在一些物理情境中,当解释变量为零时,我们预期响应变量也为零。例如,新生或未出生的婴儿由于没有牙齿,我们预期其 DPD 比率为零。但实际上,我们通常不会对这个年龄组进行预测。

一般来说,截距表示当所有解释变量都为零时响应变量的值,它也反映了模型中未包含的变量所带来的变异。除非有充分的理论依据,并且在原点附近有测量数据,否则不应强制模型过原点。如果在原点附近没有数据却强制模型过原点,实际上是在数据范围之外拟合模型,也就是在没有任何信息的情况下对响应变量的行为进行预测。此外,在这种情况下,$R^2$ 没有有意义的解释,因此不应将其用作模型评估的手段,而且残差不一定总和为零。

3. 教程

3.1 锰与钡的简单线性回归

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值