提升模型性能的方法与实践
1. 创建简单调优模型
在模型调优中,很多默认设置是合理的。例如, caret 包会使用自助抽样样本的预测准确率来为分类模型选择最佳性能者。我们可以从这些默认值开始,调整 train() 函数来设计各种实验。
1.1 调优信用评分模型
以使用 caret 包的默认设置调优信用评分模型为例,最简单的调优方法是通过 method 参数指定模型类型。由于之前在信用模型中使用了 C5.0 决策树,这里继续优化该学习器。使用默认设置调优 C5.0 决策树的基本 train() 命令如下:
library(caret)
set.seed(300)
m <- train(default ~ ., data = credit, method = "C5.0")
-
set.seed(300):初始化 R 的随机数生成器,确保结果可重复。 -
default ~ .:使用 R 公式接口定义树,用信用数据框中的所有其他特征来建模贷款违约状态(是或否)。 -
method = "C5.0":告诉caret使用 C5.0 决策树算法。
输入上述命令后,调优过程可能会有显著延迟,因为 R 要重复生成随机数
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



