线性回归预测与分类变量分析
1. 预测区间与置信区间
1.1 预测区间与置信区间的特点
预测区间(PI)和置信区间(CI)在简单线性回归模型中有着不同的特点。拟合值保持不变,但PI的宽度明显大于CI,这是因为在特定x值下,原始观测值本身的变异性自然比其均值更大。例如,对于手跨度为14.5cm的情况,模型预测个体观测值有0.95的概率介于143.3cm和175.0cm之间;对于手跨度为24cm,同样的PI估计为172.8cm和204.7cm(四舍五入到小数点后一位)。
| fit | lwr | upr |
| — | — | — |
| 159.1446 | 143.3286 | 174.9605 |
| 188.7524 | 172.8390 | 204.6659 |
1.2 区间的绘制
在R中,可以使用以下代码绘制区间:
# 绘制数据和估计的回归线
plot(survey$Height~survey$Wr.Hnd,xlim=c(13,24),ylim=c(140,205),
xlab="Writing handspan (cm)",ylab="Height (cm)")
abline(survfit,lwd=2)
# 添加拟合值的位置以及CI和PI的垂直线
points(xvals[,1],mypred.ci[,1],pch=8)
segments(x0=c(14.5,24),y0=c(mypred.pi[1,2],mypred.pi[2,2]),
x1=c(14.5,24),y1=c(mypred.pi[1,3],mypred.pi[
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



