对于如何验证预测模型在新的数据集中是否有较好的拟合性能,除了第四十二讲中介绍的交叉验证外,还有一种更加复杂但稳定的方法,叫做自举重采样验证(boostrap-resampling)。
1. 自举重采样
自举重采样(bootstrap-resampling)验证可用于测量预测模型的准确性,也可用于评价模型的不确定性。该方法为从原始数据集中重复随机选择n个观察值的样本,并评估每个副本的模型性能。然后计算平均标准误差,从而衡量模型性能总体差异。
2. 加载所需的R包
- tidyverse 便于数据操作和可视化
- caret 用于计算交叉验证
library(tidyverse)
library(caret)
3. 数据示例
我们将使用R的内置数据集swiss。
# 加载数据
library(datasets)
data("swiss")
# 查看数据(随机选取3行数据来查看)
sample_n(swiss, 3)
Fertility Agriculture Examination Education Catholic Infant.Mortality
1 77.3 89.7 5 2 100.00 18.3
2 76.1 35.3 9 7 90.57

本文介绍了使用自举重采样验证来评估预测模型的性能和不确定性。通过R语言的boot包,以线性回归为例展示了如何计算重采样数据集的模型系数标准误差,进而估算置信区间。自举法不依赖于线性模型假设,因此可能提供更准确的估计。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



