我在最近的好几场二分类赛事中,看到别人分享的kernel,都用到了KFold,因此我准备详细记录一下KFold和StratifiedKFold的用法。
1. KFold 和StratifiedKFold有什么区别
- StratifiedKFold的用法类似KFold,但是SKFold是分层采样,确保训练集,测试集中,各类别样本的比例是和原始数据集中的一致。
import numpy as np
from sklearn.model_selection import KFold,StratifiedKFold
X = np.array([
[1,2,3,4],
[11,12,13,14],
[21,22,23,24],