信用卡交易欺诈检测的无监督学习方法
1. 数据集概述
我们拥有总共 284,807 笔信用卡交易数据,其中 492 笔为欺诈交易,标记为 1;其余为正常交易,标记为 0。用于异常检测的特征有 30 个,包括时间、交易金额和 28 个主成分。我们将数据集划分为训练集(190,820 笔交易,其中 330 笔欺诈交易)和测试集(93,987 笔交易,其中 162 笔欺诈交易)。以下是加载和处理数据集的代码:
import os
import pandas as pd
from sklearn.preprocessing import StandardScaler as pp
from sklearn.model_selection import train_test_split
# Load datasets
current_path = os.getcwd()
file = '\\datasets\\credit_card_data\\credit_card.csv'
data = pd.read_csv(current_path + file)
dataX = data.copy().drop(['Class'],axis=1)
dataY = data['Class'].copy()
featuresToScale = dataX.columns
sX = pp(copy=True)
dataX.loc[:,featuresToScale] = sX.fit_transform(dataX[featuresToScale])
X_train, X_test, y_train, y_test = \
train_test_spl
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



