社交网络中的异常行为挖掘与位置描述探索
1. 借贷网络结构分析
1.1 网络连接组件
在借贷网络中,存在 85746 个最大强连通组件和 47 个最大弱连通组件。最大的强连通组件包含 3513 个顶点(占比 3.94%),而巨大的弱连通组件由 89171 个顶点(占比 99.89%)组成。
1.2 度相关性
网络的度相关性衡量顶点与具有相似度的其他顶点连接的偏好。该网络的度相关值约为 -0.03,这意味着存在轻微的非度相关性,即相似度的顶点之间没有明显的连接倾向。
1.3 时间切片分析
为了检测网络结构中边的资金流动,需要进行时间分析。以三个顶点 u、v 和 w 为例,若 u 向 v 贷款,v 向 w 贷款,只有当 v 向 w 的交易在 u 向 v 的贷款期限结束前开始,才能合理推断资金可能从 u 间接转移到了 w。
- 时间切片设置 :数据集中任何贷款的最短期限为 12 个月。为便于分析,采用 4 个月时长的时间切片,滑动窗口为 2 个月,这样可使贷款得以摊销,并让相关资金在网络中快速传播。每 2 个月产生一个新的时间切片,以第一个月进行索引,每个切片包含从第一个月开始到 4 个月结束期间开始的贷款,最终得到 36 个时间切片。
- 系统开闭影响 :从相关图表可以明显看出,2008 - 2009 年 Prosper 系统临时关闭。每次系统开放时,活跃成员数量通常会增加,用户之间的连接数量也相应增加,表现为边的数量和平均度的上升。系统开放时网络密度最高,随着成员数量增加,网络变得更加稀疏。平均最短路径长度在 Pro