信用卡欺诈数据与云安全风险管理分析
信用卡欺诈数据的机器学习分析
在信用卡欺诈检测领域,运用多种机器学习方法对相关数据进行分析至关重要。Adrian Banarescu在2015年提出使用“主动数据检测技术”来识别和预防欺诈。
本次分析使用的数据集来自Kaggle,包含2013年9月欧洲持卡人的交易细节,采用MATLAB R2021b进行分析。通过应用树方法,分别设置最大分裂数为100、20和4来构建精细树、中等树和粗糙树模型,并对比了不使用主成分分析(PCA)和使用PCA选项集的情况,同时对数据集进行了五折验证。
以下是不同模型在不使用PCA选项时的性能表现:
| 模型类型 | 准确率 | 总成本 | 预测速度 | 训练时间 |
| — | — | — | — | — |
| 精细树 | 99.9 | 2 | ~890,000 obs/s | 20.619 s |
| 中等树 | 99.9 | 156 | ~1,100,000 obs/s | 11.876 s |
| 粗糙树 | 99.9 | 213 | ~1,200,000 obs/s | 7.6955 s |
使用PCA选项时的性能表现如下:
| 模型类型 | 准确率 | 总成本 | 预测速度 | 训练时间 |
| — | — | — | — | — |
| 精细树 | 99.8% | 548 | ~580,000 obs/s | 12.401 s |
| 中等树 | 99.8% | 508 | ~540,000 obs/s | 9.4121 s |
| 粗糙树 | 99.8% | 493 | ~540,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



