论文笔记 | RGSE: Robust Graph Structure Embedding for Anomalous Link Detection

文章信息

  

来源:IEEE Transactions on Big Data.(2022)

作者:Zhen Liu, Wenbo Zuo, Dongning Zhang and Xiaodong Feng

链接:https://www.researchgate.net/publication/371431176_RGSE_Robust_Graph_Structure_Embedding_for_Anomalous_Link_Detection

代码:GitHub - wave-zuo/RGSE: Robust Graph Structure Embedding for Anomalous Link Detection

内容简介

在大数据时代,互联网和社交网络上的通信和在线互动产生了大量具有网络结构的数据。从网络数据中识别异常模式是大数据技术研究面临的主要挑战之一,这将有助于改善大数据的安全基础设施。近年来,图上的异常检测问题得到了广泛研究,其中大部分是针对节点级别的异常检测,例如DONE和ADONE、Dominant和AnomalyDAE等方法已经取得了最先进的结果。由于节点异常检测与链接异常检测之间的差异,关于边级别异常检测的方法研究较少。在现实生活中的网络中,节点之间的观察到的链接可能并不像看起来那么可信,这是由于存在异常链接或对抗性连边。例如,在社交网络中,用户之间的关注关系可能是由机器人用户建立的虚假关系;在蛋白质相互作用(PPI)网络中,蛋白质之间的相互作用可能是由于有限的实验仪器错误地检测出的假阳性链接。因此,研究如何在网络上识别链接级别的异常对于理论和实践都具有重要意义。

识别异常链接的主要挑战在于观察到的网络数据已经被异常链接污染,这意味着链接中混杂了正样本和假阳性样本。因此,现有的假阳性样本会向学习模型提供误导性的监督信号。众所周知,传统的图表示模型在处理这个问题上表现不佳,因为它们持有“所有观察到的链接都是真实的”这个基本假设。如图1所示,给定一个具有两种节点的图G,通过图卷积网络(GCN)生成的节点在二维空间中是可分离的。然而,在添加了一些异常链接的图G'中,很难区分嵌入节点的类别。已有研究报告称,大多数现有的图嵌入模型和图神经网络都存在固有的脆弱性,无法抵御异常链接的负面影响。因此,如果可以通过适当的检测方法从观察到的网络中移除异常链接,将有望解决图表示模型中的脆弱性问题。

最近的一项研究显示,导致这些模型脆弱性的原因可能是学习到的嵌入向量不够稳健。如果能够引入更稳定的图结构特征,这些特征对异常链接不敏感,在图学习框架中,可能可以获得更稳健的嵌入向量,从而有助于检测异常链接。这是本论文的第一个动机。直观地说,对于图神经网络模型来说,如果两个节点共享许多公共邻居,它们往往具有相似的邻接矩阵表示。然而,一项新研究指出,传统的图嵌入和图神经网络模型使用的是一种隐式学习方法,无法直接有效地感知节点之间邻居重叠的程度。明确定义稳定的图结构特征,而不是隐式学习图结构特征,对于增强图学习模型的表达能力至关重要。因此,显式构建基于共同邻居的特征的想法是本论文的第二个动机。

本文主要贡献:

(i) 引入了一个稳健的对比损失函数到自编码器模型中,并通过理论分析和实证验证证明了其有效性。

(ii) 提出了基于共同邻居的局部结构特征,用于表示图中的连边,这些特征对连边扰动不敏感。

(iii) 为了实现异常链接检测,从全局图结构学习和稳定局部图特征表示的角度,设计了一个基于双视图的稳健图结构嵌入模型。

Robust Graph Structure Embedding

本文优化目标为异常链接检测问题的优化目标,目标函数如下:

\min \sum_{(u, v) \in \bar{E}}\left|\mathcal{A}\left(h_{u, v}, G^{o}, \Theta\right)-\mathcal{S}(u, v)\right| \text { s.t. } h_{u, v}=\mathcal{M}\left(G^{o}, \Omega\right) \text {, }

其中,h_{u,v}是边(u,v)的嵌入向量,Θ和Ω分别对应于异常分数函数A(·)和边嵌入模型M(·)的参数。S(·)是一个指示函数,其值反映了链接的实际异常状态,即1表示正常,0表示异常。请注意,S(·)仅适用于模型评估,而扰动性连边的数量对于A(·)和M(·)都是未知的,这意味着构建A(·)和M(·)时,只能使用污染的图信息。

A. 保留拓扑信息的节点嵌入

基于图的结构信息,初始节点向量可以表示为

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值