20、数据建模中的重采样、预测与模型导出技术

数据建模中的重采样、预测与模型导出技术

1. 自助法(Bootstrapping)

自助法的目标是更精确地评估模型在数据上的可靠性。与将数据划分为训练集和测试集不同,自助法是从原始数据集中有放回地随机抽取 n 个样本,重复 N 次(N 为迭代次数,n 为样本数量),每次迭代中同一案例可能多次出现。然后对每个样本独立进行分析,得出估计值的均值和标准差。

在 R 语言中使用 caret 包进行自助法的操作步骤如下:

# 指定自助法参数
CtrlBoot = trainControl(method="boot", number=1000)

# 以鸢尾花数据集为例,构建不同模型
# 朴素贝叶斯模型
modelNBboot = train(Species ~ ., data = iris, 
   trControl = CtrlBoot, method = "nb")
# C4.5 模型
modelC45boot = train(Species ~ ., data = iris, 
   trControl = CtrlBoot, method = "J48")
# C5.0 模型
modelC50boot = train(Species ~ ., data = iris,
   trControl = CtrlBoot, method = "C5.0")
# CART 模型
modelCARTboot = train(Species ~ ., data = iris, 
   trControl = CtrlBoot, method = "rpart")
# 随机森林模型
modelRFboot = train(Species ~ 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值