线性回归模型中的统计推断与预测能力评估
1. 同方差性下的推断
在进行统计推断时,有一个重要的公式:$s^2\lambda’(A’A)^{-1}\lambda$ 。这里我们可以用分母为 $n$ 来计算 $s^2$ ,而不是之前提到的 $n - p - 1$ 。另外,R 语言中的 vcov() 函数可以为 lm() 以及后续会遇到的其他回归建模函数提供矩阵 $(2.57)$ 。
即使在随机 $X$ 的设置下,上述陈述的条件性质也不是问题。例如,我们基于 $A$ 为某个量构建一个 95% 的置信区间。设 $V$ 是一个指示变量,表示该区间包含感兴趣的量这一事件。则有:
$P(V = 1) = E[P(V = 1 | A)] = E(0.95) = 0.95$
这表明无条件覆盖概率仍然是 95% 。
1.1 共享单车数据示例
我们以共享单车数据为例来构建一些置信区间。
lmout <- lm(reg ~ temp+temp2+workingday+clearday, data=shar)
summary(lmout)
输出结果如下:
| 系数 | 估计值 | 标准误差 | t 值 | Pr(>|t|) |
| — | — | — | — | — |
| (Intercept) | -1362.56 | 232.82 | -5.852 | 1.09e - 08 |
| temp | 11059.20 | 988.08 | 11
超级会员免费看
订阅专栏 解锁全文
1462

被折叠的 条评论
为什么被折叠?



