通用超图神经网络(HGNN+)

原创

已于 2024-07-16 11:16:31 修改 · 2k 阅读

31 ·

CC 4.0 BY-SA版权

文章标签：

#神经网络 #人工智能 #深度学习

于 2024-07-16 11:15:21 首次发布

最近正在学习超图理论，本文对论文 HGNN+: General Hypergraph Neural Networks (TPAMI 2022) 进行详细的讲解。欢迎讨论！
论文地址：HGNN+

在这里插入图片描述

超图是一种图的推广形式，是一种高效的特征表示学习方法。在超图中，一条超边不仅可以连接两个顶点，还可以连接多个顶点，从而更好地捕捉复杂的高阶关系。在超图中，顶点表示对象，超边表示对象之间的高阶关联。例如，在一个社交网络中，一个超边可以表示多个用户之间的群组关系，而不仅仅是成对的好友关系。超图因其灵活性和丰富的表达能力，广泛应用于社交网络分析、生物信息学、推荐系统、视觉等领域，能够更有效地建模和分析复杂的多层次数据关联。

1. 超边的构建

在没有原生的超图结构的情况下，论文介绍如何从原始数据中构建一个灵活的超图结构。超图结构用于建模数据关联。为了更好地利用数据之间的高阶关联，生成一个良好的超图结构是非常重要的。需要注意的是，大多数情况下并不存在显式的超图结构。因此，我们需要使用不同的策略来生成超图。

通常，从零开始生成超图的情况可以分为三种情形，即具有图结构的数据、没有图结构的数据以及具有多模态/多类型表示的数据。给定数据，本文介绍了三种超边生成策略，分别是使用成对边、 $k$ -hop和特征空间中的邻居：

使用成对边和 $k$ -hop的方法用于从具有图结构的数据中生成超边组
使用特征空间中的邻居的方法用于从没有图结构的数据中生成超边组。

在这里插入图片描述

1.1 数据关联具有图结构的情况

在某些场景中，存在可用的成对数据关联，例如数据的现有图结构。这里我们用 $\mathcal{G}_s=\left(\mathcal{V}_s, \mathcal{E}_s\right)$ 表示图结构，其中 $v_i \in \mathcal{V}_s$ 是一个顶点， $e_{s_{i j}} \in \mathcal{E}_s$ 是图中连接 $v_i$ 和 $v_j$ 的边。令 $A$ 表示 $\mathcal{G}_s$ 的邻接矩阵。给定这样的图结构，可以生成两种类型的超边组如下：

使用成对边的超边组（ $\mathcal{E}_{\text{pair}}$ ）。 $\mathcal{E}_{\text{pair}}$ 旨在将图结构直接转换为一组 2-一致性超边，如图4a顶部所示，其中该组中的每个超边 $e_{ij}$ 只连接图 $\mathcal{G}_s$ 中对应边的两个顶点 $v_i$ 和 $v_j$ ：
$\mathcal{E}_{\text{pair}}=\left\{\left\{v_i, v_j\right\} \mid\left(v_i, v_j\right) \in \mathcal{E}_s\right\}。$ $\mathcal{E}_{\text{pair}}$ 能够完全覆盖图结构中的低阶（成对）关联，这是高阶关联建模所需的基本信息。

这就像是在一个已有的网络中，每两个有直接连接的节点都被看作是一组。比如，在一个社交网络中，每对好友之间的关系都被单独看作一组。
使用 $k$ -hop邻居的超边组（ $\mathcal{E}_{\text{hop}}$ ）。 $\mathcal{E}_{\text{hop}}$ 旨在通过图结构中的 $k$ -跳可达位置找到中心顶点的相关顶点，如图4a底部所示。图 $\mathcal{G}_s$ 中顶点 $v$ 的 $k$ -跳邻域定义为： $N_{\text{hop}_k}(v)=\left\{u \mid \mathbf{A}_{w w}^k \neq 0, u \in \mathcal{V}_s\right\}$ 。这里 $k$ 的取值可以在 $\left[2, n_v\right]$ 范围内变化，其中 $n_v$ 是 $\mathcal{G}_s$ 中的顶点数。具有 $k$ -跳的超边组 $\mathcal{E}_{\text{hop}}$ 可以写成：
$\mathcal{E}_{\text{hop}_k}=\left\{N_{\text{hop}_k}(v) \mid v \in \mathcal{V}\right\}。$ $\mathcal{E}_{\text{hop}}$ 通过扩展图结构中的搜索半径，能够为中心顶点找到外部相关顶点，从而生成顶点组而不仅仅是两个顶点的超边。相比于 $\mathcal{E}_{\text{pair}}$ 中的成对关联，它可以提供更丰富的关联信息。

这相当于在一个网络中，不仅考虑直接连接的好友关系，还考虑了“朋友的朋友”甚至“朋友的朋友的朋友”的关系。这样可以找到更多与某个节点相关的节点组。

1.2 数据关联没有图结构的情况

当数据没有可用的图结构时，我们需要采用不同的方法来构建它。通常，对于每个主体可能有两种类型的数据：一种是属性类数据，另一种是与每个顶点相关的特征。

使用属性的超边组（ $\mathcal{E}_{\text{attribute}}$ ）。给定属性类数据，例如地理位置、时间和其他不同主体共享的特定信息，可以生成使用属性空间中邻居的超边组，如图4b顶部所示，其中每个超边代表一个属性 $a$ （或该属性的一个子类型，如果可用）并连接所有共享相同属性的主体。共享属性 $a$ 的顶点子集可以表示为 $N_{\text{att}}(a)$ 。 $\mathcal{A}$ 是包含所有属性或属性子类型的集合。来自属性的这一组超边可以写成：
$\mathcal{E}_{\text{attribute}}=\left\{N_{\text{att}}(a) \mid a \in \mathcal{A}\right\}。$ $\mathcal{E}_{\text{attribute}}$ 可以从群组级别建模属性空间中的关联。

这类似于将拥有相同属性（例如住在同一地区或在同一时间段活动）的所有个体归为一组。比如，所有居住在同一个邮政编码区域的人被看作是一组。
使用特征的超边组（ $\mathcal{E}_{\text{feature}}$ ）。给定每个顶点的特征，第二种类型的 $\mathcal{E}_{\text{feature}}$ 可以通过在特征空间中找到每个顶点的邻居来生成。在这里可以采用不同的策略。给定一个顶点作为中心点，在特征空间中其 $k$ -近邻可以通过一个超边连接，或者可以选择所有在距离 $d$ 以内的邻居（包括中心点），如图4b底部所示。
$\left\{ \begin{array}{l} \mathcal{E}_{\text{feature}}^{\mathrm{KNN}_k}=\left\{N_{\mathrm{KNN}_k}(v) \mid v \in \mathcal{V}\right\} \\ \mathcal{E}_{\text{feature}}^{\text{distance}_d}=\left\{N_{\text{dis}_d}(v) \mid v \in \mathcal{V}\right\} \end{array}。 \right.$