实时信用卡欺诈检测与面部识别技术研究
1. 实时信用卡欺诈检测
随着在线购物的兴起,信用卡欺诈事件急剧增加。为应对这一问题,构建了一个实时信用卡欺诈检测系统,该系统结合了 Apache Spark、Kafka 和机器学习算法。
1.1 数据处理与模型训练
- 运用 Spark SQL 对不平衡数据进行处理和平衡,随后使用 SparkML 和 Scikit - learn 库训练了 10 种不同的机器学习模型。
- 采用合成少数过采样技术(SMOTE)、欠采样和过采样等数据预处理技术,成功平衡了原始数据集。新数据集的类别分布如图 2 所示。
| 机器学习模型 | 误差 |
|---|---|
| 决策树 | 120 |
| 逻辑回归 | 200 |
| KNN | 150 |
| 线性 SVM | 450 |
| 多项式 SVM | 75 |
| 随机森林 | 60 |
从测试结果来看,随机森林算法在验证集上的误差最
超级会员免费看
订阅专栏 解锁全文
45

被折叠的 条评论
为什么被折叠?



