应用机器学习:信用违约识别与高级概念探索
1. 信用违约识别基础
在机器学习项目中,信用违约识别是一个重要的应用场景。通过一系列步骤,我们可以构建一个有效的模型来预测客户是否会违约。
首先,运行代码片段会得到如下输出:
Best parameters: {'classifier': DecisionTreeClassifier(max_depth=10,
min_samples_leaf=7, random_state=42), 'classifier__criterion': 'gini',
'classifier__max_depth': 10, 'classifier__min_samples_leaf': 7, 'preprocessor__
numerical__outliers__n_std': 4}
Recall (Training set): 0.3858
Recall (Test set): 0.3775
这表明经过调优的决策树模型表现优于树的集成模型。不过,我们可以通过对随机森林分类器进行更多调优来改变结果,因为目前仅对众多超参数中的两个进行了调优。
我们可以使用以下代码片段来提取并打印所有考虑的超参数/分类器组合,从最佳组合开始:
pd.DataFrame(classifier_gs_2.cv_results_).sort_values("rank_test_score")
在这个过程中,我们完成了以下几个关键步
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



