1、图算法在风控场景的应用_图算法 风控_DataFunTalk的博客-优快云博客
这篇文章简要介绍了
1)几种图算法:图论算法、图机器学习、图挖掘算法。
2)图在风控中的演化方式:从规则到算法,从一阶的特征聚合 到 利用图做多阶特征的聚合
3)介绍了一些图算法框架:GraphX、腾讯Plato、腾讯 Angle 图、NebulaGraph、线上实时模型查询推理系统(DGL+ SageMake+Nebula)、DGL-Message Passing
介绍图算法在账号维度的黑产挖掘
1)业务目标有两方面:
* 找出目标恶意类别用户。比如需要找出散播招嫖信息的用户,则给定该类用户招嫖的标签,类似于一个用户定性的问题;
* 黑产种子用户扩散,即利用历史的黑产用户进行用户扩散以及用户召回
2)手段:GraphSAGE
* GraphSAGE核心思想主要为两点:邻居抽样;特征聚合。
* 本文中做的优化:聚合优化、采样优化、剪枝优化
3)效果评估:指标主要有两个:聚类(社区)准确率;召回恶意率。
通过图算法去识别这种刷流量的黑产(刷流量指的是主播的人气,一个是主播的关注等)
1)算法的整体架构:算子、算法、应用。算法包括图构建、图传播、图分割、图嵌入
2)图算法风控建模
* 图的优势:黑产有时间和群体聚集性,图跟黑产作案的特征是非常契合的。图算法对新攻击的对抗性会比较高,图的拓扑结构让黑产很难去发掘究竟是哪一块被操作了。
* 建模流程:
a.图构建:节点和边的定义
b.图算法任务:图的有监督、图的无监督、图表征学习
c.图可解释性:统计挖掘的团伙的一些统计指标;通过图结构/实体向量表征去做衍生特征;第三种是一个通过聚集性信息去描述。
d.业务应用:事前拦截(少量账户作案时,拦截其他账户),作案后处置,风险评分。
3)实战案例1:序列x图
行为序列抽取 -> 序列Embedding -> 相似序列挖掘
4)实战案例2:全场景刷量团伙挖掘
定义特征 -> 定义特征距离的计算方式 -> 计算初始团伙 -> 合并成新团伙
待更新。。