【DiffGAD: A Diffusion-based Unsupervised Graph Anomaly Detector】

DiffGAD

https://openreview.net/forum?id=AhcYq4CnfF

阅读2025

一种基于扩散模型的无监督图异常检测器

Abstract

传统的无监督方法以重构为重点,对未标记数据的编码的潜在表示进行解码,通常无法捕获关键的判别性内容,导致异常检测不理想。DiffGAD的核心是一种全新的潜在空间学习范式,通过精心设计,使用判别内容来指导模型,从而提高模型的熟练程度。利用扩散采样向潜在空间注入判别性内容,并引入内容保存机制,在不同尺度上保留有价值的信息,显著提高了模型在有限时间和空间复杂度下识别异常的熟练程度。在6个大规模数据集上进行了评估,卓越性能。

1 Introduction

第一段介绍图结构,引出graph anomaly detection。

第二段介绍现有研究可分为:半监督学习和无监督学习。并指出半监督学习的挑战。

第三段指出无监督重建策略。利用编码器将图数据映射到潜在空间。实体从这些潜在嵌入中解码,其中那些表现出高重建误差的实体被认为更有可能是异常。但是这些方法在判别能力上存在局限性,导致性能不佳。举例,不正常用户经常故意把自己伪装成正常用户,经常与普通用户在共同属性上表现出显著的重叠。这种行为使得这些异常能够将基于重建的模型的焦点转移到重叠的公共内容上,降低模型辨别真正区别特征的能力,例如用于欺诈检测的交易信息。因此在这样一个平凡的框架下,很难通过重构误差来识别异常实体。如图1(a)所示,潜在空间中的所有数据点是均匀分布的,没有保留足够的判别性内容,导致分布空间重叠。
在这里插入图片描述

上述图1,蓝色、红色分别代表正常节点和异常节点,a,b,c的数据空间分别由不同的方法构造的。a表示是由当前基于重构方法构建的潜在空间,在introduction中介绍到,可以看到数据点都是均匀分布的,没有保留足够的判别性内容,导致正常和异常的分布空间重叠。b表示的是通过隔离得到的discriminative content集成到潜在空间中,学习得到的分布,使得在潜在空间的重叠区域内,能够分离正常分布和异常分布,实现正常和异常样本的区分。(在introduction中第5段介绍)。c表示的是在b基础上通过引入保留的一般内容,扩大正常和异常实体之间的分布差异,从而得到更好的数据表征,(在introduction中第6段介绍)。

第四段,指出基于AE-based method构建的潜在空间,在Books数据集上,倾向于将所有样本表示为同一点,这被巨大的共同内容说误导。而利用VAE based method,面临的一个显著挑战就是,他是在一个受限分布(例如高斯分布)内构建潜在空间的,导致潜在分布均匀。限制了模型的表达力,使得区分异常和正常样本具有挑战性。如何解决的,文章提出引入判别性内容来增强潜在空间学习过程。从扩散模型的强大生成能力中汲取灵感,引入一种基于扩散的检测方法,DiffGAD。

问题是,潜在空间数据点均匀分布,没有足够判别特征,模型表达力不足

具体来讲,从两个方面解决这个问题

第五段,由于异常的稀疏性,判别性内容很难捕获,然而,共享内容更容易获取。因此,我们隐式的捕获这种判别信息。怎么做的:先训练一个无条件的DM,专注于构建包含判别性和公共元素的特征,称为一般内容。随后,通过一个共同特征的条件反射训练第二个DM,学习包含共同内容的潜在分布,其中共同特征则是通过自适应过滤掉无条件DM重构空间中的潜在异常来构建的。通过将一般内容与这种共性区分开,隔离到了判别内容。然后通过在两个训练好的DM之间应用无分类器制导,将discriminative content集成到潜在空间中。如图1(b)所示,这个过程允许潜在空间在重叠区域内分离正态分布和异常分布,从而实现异常和正常样本的区分。

第五段讲的就是模型原理,第一个DM学习到的是discriminative content + common content = general content,第二个DM学习到的是common content,隔离就得到了潜在的discriminative content

第六段,考虑到基于重建误差的异常检测基本上更符合分类而不是生成,对扩散模型进行了轻微修改,以更好适应这项任务。具体,在采样阶段,不是从高斯分布开始,而是通过添加小时间步长t的噪声对给点样本x引入轻微的破坏,然后降噪以生成重构样本。在整个过程,我们认为一般内容能够在不同的尺度上保留,以进一步增强模型的判别能力。具体来说,较小的t值下的噪声保留了大规模的一般内容,而较大的t值则保留了更局部的一般内容。如图1©所示,通过保留这些内容,构建的潜在空间善于准确的表示数据点,这种增强有效的扩大了正常和异常实体之间的分布差异,产生了一个鲁棒的和判别的潜在空间,从而培养了自信的表征。

贡献:

  • 据我们所知,我们首次尝试将扩散模型(DM)从生成任务转移到GAD任务中的检测器,并提出了基于DM的图异常检测器,即DiffGAD。

  • 我们的DiffGAD从两个方面增强了识别能力:一个以判别性内容为导向的生成范式,从潜在空间中提取判别性内容;并提出了内容保存策略,增强了引导过程的信心。

  • 在六个真实世界和大规模数据集上的广泛实验证明了我们的有效性,理论和经验计算分析说明了我们的效率。

2 BackGround

2.1 Task Formulation

关注静态属性图上的无监督图节点异常检测。在基于重构的方法中,异常评分就是重构误差。

2.2 Diffusion Model in Latent Space

潜扩散模型(Latent DM)是基于随机微分方程(SDE)的统一表述,由一对正向和反向扩散过程组成。具体地说,给定一个潜在变量z, SDE可以形式化为:

在这里插入图片描述

其中f和g分别是漂移函数和扩散函数。

**forward proces

### 解决 `cd` 命令无法找到 `stable-diffusion-webui` 文件夹的问题 当遇到 `cd` 命令找不到指定文件夹的情况时,通常是因为当前工作路径不正确或是目标文件夹不存在于预期位置。以下是几种可能的原因及解决方案: #### 1. 确认文件夹存在及其绝对路径 确保 `stable-diffusion-webui` 文件确实存在于所期望的位置。可以使用 `ls` 或者 `find` 来查找文件夹。 ```bash # 列出当前目录下的所有文件和子目录 ls -la # 查找名为 'stable-diffusion-webui' 的文件夹 find /path/to/search -type d -name "stable-diffusion-webui" ``` 如果通过上述方法找到了文件夹的确切位置,则可以直接切换到该文件夹[^1]。 #### 2. 使用绝对路径而非相对路径 有时相对路径可能会引起混淆,尤其是在脚本执行过程中改变了默认的工作目录。因此建议始终尝试使用完整的绝对路径来访问文件夹: ```bash cd /full/path/to/stable-diffusion-webui/ ``` 这一步骤能够有效避免因相对路径引起的定位失败问题[^3]。 #### 3. 检查克隆仓库过程是否有误 假如是从 GitHub 上拉取项目源码创建此文件夹的话,请确认 Git 克隆操作顺利完成,并且没有因为网络原因中途中断而导致文件夹未被成功建立。 ```bash git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git ``` 若之前的操作未能完成,可再次运行以上命令重新获取最新版本的代码库。 #### 4. 调整权限设置 某些情况下,由于权限不足也可能导致无法正常读写甚至查看特定文件夹的内容。此时可以通过修改文件夹所属用户组以及相应的读写权限来进行修复。 ```bash sudo chown -R $USER:$USER ./stable-diffusion-webui chmod -R u+rwx ./stable-diffusion-webui ``` 这些指令会将文件夹所有权分配给当前登录用户并授予其完全控制权,从而允许顺利进入文件夹内进行后续操作[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值