多元线性回归:预测、变换与模型评估
1. 多元线性模型预测
多元回归的预测规则与简单回归相同。在进行预测时,需要牢记以下几点:
- 特定协变量组合的点预测与响应变量的均值(或期望值)相关。
- 置信区间用于衡量均值响应。
- 预测区间用于衡量原始观测值。
- 还需考虑插值(基于原始观测协变量数据范围内的 x 值进行预测)和外推(基于超出该范围的 x 值进行预测)的问题。
以学生身高作为手跨度和性别(在 survmult 模型中)的线性函数为例,我们可以估计特定学生的平均身高及相应的置信区间。以下是具体的代码示例:
# 估计男性学生平均身高及 95% 置信区间
predict(survmult, newdata = data.frame(Wr.Hnd = 16.5, Sex = "Male"),
interval = "confidence", level = 0.95)
# 估计女性学生平均身高及 99% 预测区间
predict(survmult, newdata = data.frame(Wr.Hnd = 13, Sex = "Female"),
interval = "prediction", level = 0.99)
然而,在实际应用中,可能会出现观测值落在预测区间之外的情况。例如,在数据集中有两名手跨度为 13cm 的女生,其中一名女生的身高明显高于 99% 预测区间的上限。这可能有以下几个原因:
1. 模型不充分 :拟合模型中可能
超级会员免费看
订阅专栏 解锁全文
1186

被折叠的 条评论
为什么被折叠?



