Environment-Aware Dynamic Graph Learning for Out-of-Distribution Generalization 文章解读

在这里插入图片描述

1. 总结

Environment-Aware dynamic Graph LEarning(EAGLE)框架,首次从环境学习视角解决动态图的分布外(OOD)泛化问题。针对现有动态图神经网络(DGNNs)依赖I.I.D.假设、易捕获虚假关联的缺陷,EAGLE通过四大核心模块实现OOD泛化:
1)环境感知EA-DGNN,基于多通道环境解纠缠建模潜在环境(如学术网络的“研究领域”、社交网络的“关系类型”);
2)环境实例化机制,结合多标签变分自编码器(ECVAE)生成多样化环境样本,弥补训练环境覆盖不足;
3)不变模式识别机制,通过动态规划(Proposition2)实现节点级时空不变模式划分,满足“不变性+充分性”理论条件;
4)时空因果干预机制,基于观测与生成样本进行节点级细粒度干预,最小化经验风险与不变风险。在COLLAB(16年学术合作)、Yelp(24个月用户评价)、ACT(30天MOOC行为)三个真实数据集的未来链接预测任务中,EAGLE在链接属性偏移、节点特征偏移场景下均显著优于静态GNN(GAE、VGAE)、动态GNN(EvolveGCN、DySAT)及OOD方法(IRM、DIDA),例如COLLAB的OOD场景AUC达84.41%,超越DIDA的81.87%,验证了其泛化能力。

2. 思维导图(mindmap)

在这里插入图片描述

3. 详细总结

EAGLE框架:动态图分布外(OOD)泛化的详细总结

1. 研究背景与核心问题

1.1 动态图的重要性与应用

动态图(定义为 DG=Gtt=1TDG = {G^t}_{t=1}^TDG=Gtt=1T,含T个离散快照)是现实场景的重要数据形式,典型应用包括:

  • 学术合作网络(COLLAB):节点为作者,边为合作关系,时间跨度16年(1990-2006),含5类边属性(如“数据挖掘”“理论”);
  • 用户评价网络(Yelp):节点为用户/商家,边为评价行为,时间跨度24个月(2019-2020),含5类商家类别(如“披萨”“咖啡”);
  • 在线学习行为网络(ACT):节点为学生/学习目标,边为交互行为,时间跨度30天,含5类行为聚类属性。

核心任务为未来链接预测:基于历史快照G^1:T,训练模型fθ=w∘gf_θ = w∘gfθ=wg(w为DGNN编码器,ggg为链接预测器),预测T+1时刻边的存在性(YTY^TYT)。

1.2 现有方法的关键缺陷

缺陷类型 具体表现 示例
依赖I.I.D.假设 训练与测试数据需同分布,真实场景中分布偏移普遍存在 季节变化导致用户饮品购买偏好改变,模型预测失效
捕获虚假关联 时空卷积会强化非因果关联,降低OOD泛化能力 模型误将“冰美式-寒冷季节”的虚假关联作为预测依据
忽略潜在环境 动态图生成受多环境因素影响,但未建模这些因素 学术网络中“研究领域”影响合作关系,模型未区分不同领域

1.3 OOD泛化的三大核心挑战

  1. 环境建模与推断:动态图的潜在环境(如“研究领域”“季节”)随时间变化且相互耦合,如何有效建模并推断其分布?
  2. 不变模式发现:如何从推断的环境中,提取跨环境稳定的时空不变模式(如“用户购买咖啡”的核心需求),过滤变体模式(如“冰饮偏好”)?
  3. 因果干预:如何通过干预变体模式,消除虚假关联,确保模型在未见过的OOD环境中泛化?

2. 问题定义

2.1 动态图学习基础符号

符号 含义 维度/类型
Gt=(Vt,Et)G^t = (V^t, E^t)Gt=(Vt,Et) t时刻图快照 -
AtA^t At t时刻邻接矩阵 0,1N×N{0,1}^{N×N}0,1N×N, ( N=VtN=V^tN=Vt )
Xt X^tXt t时刻节点特征矩阵 RN×dR^{N×d}RN×dddd为特征维度)
fθ f_θfθ 预测模型(w∘g) 输入G1:TG^1:TG1:T,输出 Y^TŶ^TY^T
eee 潜在环境变量 离散/连续(如研究领域、季节)
EEE 环境支撑集 训练环境Etrain⊆E_{train} ⊆Etrain测试环境EtestE_{test}Etest

2.2 OOD泛化的目标函数

  • 传统ERM目标(依赖I.I.D.假设,公式1):
    minθE(G1:T,YT)∼p(G1:T,YT)[ℓ(fθ(G1:T),YT)]min _{\theta} \mathbb{E}_{\left(\mathcal{G}^{1: T}, Y^{T}\right) \sim p\left(G^{1: T}, Y^{T}\right)}\left[\ell\left(f_{\theta}\left(\mathcal{G}^{1: T}\right), Y^{T}\right)\right]minθE(G1:T,YT)p(G1:T,YT)[(fθ(G1:T),YT)]
  • OOD泛化目标(最小化最坏环境风险,公式2):
    minθmaxe∈EE(G1:T,YT)∼p(G1:T,YT∣e)[ℓ(fθ(G1:T),YT)∣e]min_{\theta }max_{e\in E}\mathbb {E}_{\left( \mathcal {G}^{1:T},Y^{T}\right) \sim p(G^{1:T},Y^{T}| e)}\left[ \ell \left( f_{\theta }\left( \mathcal {G}^{1:T}\right) ,Y^{T}\right) | e\right]minθmaxeEE(G1:T,YT)p(G1:T,YTe)[(fθ(G1:T),YT)e]
    核心挑战:环境eee不可观测,且EtrainE_{train}Etrain无法覆盖所有EtestE_{test}Etest

3. EAGLE框架的四大核心模块

EAGLE遵循“环境建模→环境推断→不变模式识别→环境泛化”的闭环范式,各模块设计如下:

3.1 模块1:环境建模——环境感知DGNN(EA-DGNN)

3.1.1 核心设计:多通道环境解纠缠

目标:将节点的时空表示分解到K个环境子空间,区分不同潜在环境的影响(如学术网络的K个研究领域)。

3.1.2 关键组件:环境感知卷积层(EAConv)

遵循“空间优先、时间其次”的卷积范式,分三步实现:

  1. 环境子空间投影(公式3):将节点特征结合相对时间编码(RTE(t)),投影到K个环境子空间:
    zv,kt=σ(Wk⊤(xvt⊕RTE(t))+bk)z_{v, k}^{t}=\sigma\left(W_{k}^{\top}\left(x_{v}^{t} \oplus RTE(t)\right)+b_{k}\right)zv,kt=σ(Wk
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值