
Kaggle
Yaphat
这个作者很懒,什么都没留下…
展开
-
German Credit Risk(德国信用卡违约分析)
数据信息先看下数据格式: 总共有20个属性,1个类别特征。信息如下:Attribute 1: (qualitative) Status of existing checking account A11 : … < 0 DM A12 : 0 <= … < 200 DM A13 : … >= 200 DM / salary assignments for at least 1 year原创 2017-03-29 22:44:46 · 11489 阅读 · 5 评论 -
Credit Card Fraud Detection(信用卡诈欺侦测)Spark建模
数据格式这个数据来自2013年9月欧洲信用卡交易数据,总共包括两天的交易数据。在284,807次交易中发现了492例诈骗。数据集极其不平衡,诈骗频率只占了交易频次的0.172%。 这个数据因为涉及敏感信息,用PCA处理过了,V1,V2,…V28是主成分,‘Time’和‘Amount’是没有经过PCA处理的。‘Time’是每次交易与第一次交易之间距离的时间,以秒计。‘Amount’代表消费金额,‘C原创 2017-04-02 16:14:43 · 8593 阅读 · 5 评论