利用机器学习技术进行信用卡欺诈检测的混合分析
1 引言
信用卡欺诈是一个严重的问题,给金融机构和消费者带来了巨大的损失。机器学习技术为信用卡欺诈检测提供了有效的解决方案。通过不同的机器学习算法和技术,可以对信用卡交易数据进行分析,识别出潜在的欺诈交易。
2 相关研究
许多研究人员提出了使用集成机器学习的欺诈检测模型。例如,A Mishra 在 2018 年使用了梯度提升树、随机森林和堆叠分类器等集成技术,结合其他分类算法,构建了一个能够更准确检测欺诈的机器学习模型。该数据集通过欠采样和 SMOTE 过采样技术进行采样,结果显示,采样后的数据集提高了所有分类器的召回率和准确率,梯度提升集成模型在实际数据集和采样数据集上都能有效工作。
还有研究使用集成机器学习技术,结合一些监督和无监督分类器进行信用卡欺诈检测。在一个高度不平衡的数据集上(284,807 笔交易中只有 492 笔欺诈交易),研究得出结论:在高度不平衡的数据集情况下,无监督算法比其他两种应用技术更能有效处理数据集的偏斜。
另外,有人提出了基于 C4.5 算法的集成学习框架。通过分区和聚类方法平衡原始数据集,具体步骤如下:
1. 分区 :将数据集划分为训练集和测试集,然后随机划分训练集的多数类。
2. 聚类 :对所有多数类块进行聚类。
3. 合并 :将每个类的质心的最近邻与少数类合并。最终生成 n 个平衡的数据集,使用 C4.5 算法作为基础估计器,并在每个平衡数据集上并行训练,通过基础估计器的投票构建最终分类器,实验结果显示评估指标(A
超级会员免费看
订阅专栏 解锁全文
3142

被折叠的 条评论
为什么被折叠?



