信用卡欺诈检测:机器学习实战
1. 生成特征矩阵和标签数组
在进行机器学习模型训练之前,我们需要创建并标准化特征矩阵 X ,同时分离出标签数组 y (欺诈为 1,非欺诈为 0)。这些数据将在后续训练机器学习算法时使用。
- 创建特征矩阵
X和标签数组Y
dataX = data.copy().drop(['Class'], axis=1)
dataY = data['Class'].copy()
- 标准化特征矩阵
X
为了使特征矩阵中的每个特征(除时间外)均值为 0,标准差为 1,我们进行如下操作:
featuresToScale = dataX.drop(['Time'], axis=1).columns
sX = pp.StandardScaler(copy=True)
dataX.loc[:, featuresToScale] = sX.fit_transform(dataX[featuresToScale])
标准化后的特征统计信息如下表所示:
| 特征 | count | mean | std | min | 25% | 50% | 75% | max | <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



