图机器学习(20)——欺诈交易检测算法
0. 前言
随着电子商务平台的兴起,在线支付系统的普及,欺诈案件也在增加。例如,使用被盗信用卡进行的交易就是一种典型的欺诈行为——这类交易模式必然与信用卡原持有人的正常消费存在显著差异。然而,构建自动检测欺诈交易的程序可能是一个复杂的问题,因为涉及的变量数量庞大。
我们已经学习了如何将信用卡交易数据转化为图结构,在本节中,我们将运用机器学习算法实现欺诈交易的自动识别。逐步处理数据集,最终构建一套完整的欺诈检测算法。
1. 欺诈检测
在本节中,我们将阐述如何利用二分图与三分图,通过图机器学习算法构建基于监督式与非监督式方法的欺诈自动检测流程。交易行为在图中以边表示,因此我们的核心任务是对每条边进行正确分类:欺诈性交易或真实交易。执行分类任务的流程如下:
- 针对数据不平衡任务的采样方案
- 采用无监督嵌入算法为每条边生成特征向量
- 在已定义的特征空间上应用监督式与无监督式机器学习算法
2. 基于监督学习的欺诈交易识别
由于数据集存在严重不平衡问题(欺诈交易仅占全部交易的 2.83%),我们需要采用技术手段处理数据失衡。本节将使用简单的随机欠采样策略:从多数
订阅专栏 解锁全文
535

被折叠的 条评论
为什么被折叠?



