信用卡交易欺诈识别模型

该博客探讨了信用卡交易欺诈识别问题,处理了不平衡数据集,采用了xgboost算法并结合SMOTE算法进行过采样。通过参数调优,特别是调整max_depth,发现模型在过采样后的数据上训练,f1-score和roc_auc_score显著提升,提升了欺诈交易的检测效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

项目介绍:原始数据中共有284807条数据,30个特征,其中正常交易数据为284315条,欺诈交易数据为492条,为典型的不平衡数据集。案例中采用xgboost算法,分别在原始样本和经过smote算法采样后的样本进行预测。其中xgboost使用gridsearchcv进行参数调优,鉴于调优时间过长,只对参数max_depth(树的深度)进行调优,并将调优后的最佳参数的模型对样本进行预测,对两种情况下的accuracy、f1-score、recall、precision和roc_auc_score进行比较。发现经过smote算法过采样后,f1-score和roc_auc_score得到明显提升。

相关参考:

1)关于非平衡样本数据的处理:https://www.zhihu.com/question/269698662/answer/352279936

2)关于smote算法的使用(使用Imblearn库): https://zhuanlan.zhihu.com/p/137826761

代码部分:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值