统计学习与监督式机器学习入门
统计学习基础
线性回归预测
在对数据进行预测时,线性回归是常用的方法之一。以一个数据集为例,通过以下代码可以进行线性回归分析并预测:
attach(faithful) # 加载数据框
my.lm = lm(eruptions ~ waiting)
w = data.frame(waiting=80)
predict(my.lm, w, interval = "confidence")
运行上述代码后,得到的结果如下:
## fit lwr upr
## 1 4.17622 4.104848 4.247592
这表明,当等待时间为 80 分钟时,预期喷发时间的 95% 置信区间为 [4.105, 4.248]。
预测区间
预测区间的定义为:$(x - s, x + s)$ 。与置信区间相比,预测区间更宽。当等待时间为 80 分钟时,使用以下代码预测喷发时间:
predict(my.lm, w, interval = "predict")
结果如下:
## fit lwr upr
## 1 4.17622 3.196089 5.156351
这意味着,我们有 95% 的把握认为,当等待时间为 80 分钟时,喷发时间将在 3.2 到 5.2 分钟之间。 <
统计学习与监督式机器学习
超级会员免费看
订阅专栏 解锁全文
17万+

被折叠的 条评论
为什么被折叠?



