一、背景介绍
这个数据来自欧洲信用卡交易数据,总共包括两天的交易数据。在284,807次交易中发现了492例诈骗。数据集极其不平衡,诈骗频率只占了交易频次的0.172%。
二、观察数据
1.数据源
本文的数据源从Kaggle官方网站下载,该数据集共计284807条数据,变量总数为31个。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
df1 = pd.read_csv('creditcard.csv')
df1['Class'].value_counts()