图嵌入技术:从浅层到深层的全面解析
1. 监督嵌入方法
在众多应用场景中,我们不仅拥有节点特征和图结构,还具备标注数据。虽然可以先学习无监督表示,再将其作为特征用于二次模型来处理监督任务,但这并非理想的工作流程。因为无监督节点嵌入可能无法保留对下游监督任务最有用的图的重要属性,如节点邻域或属性。为克服这一局限,人们提出了许多将学习嵌入和预测节点或图标签这两个步骤相结合的方法,下面先介绍一些简单的浅层方法。
1.1 标签传播(Label Propagation,LP)
标签传播是一种非常流行的基于图的半监督节点分类算法。其编码器是一个由查找表 Z 表示的浅层模型,LP 直接使用标签空间来表示节点嵌入,即解码器就是恒等函数:
$\hat{y}_N = DEC(Z; \Theta_C) = Z$
LP 通过在损失函数中添加正则化项,利用图结构来平滑图上的标签分布,其底层假设是相邻节点应该具有相似的标签,即连接节点之间存在一定的标签一致性。在正则化中使用拉普拉斯特征映射来实现这种平滑性,正则化项如下:
$L_{G,RECON}(W, \tilde{W}; \Theta) = \sum_{i,j} W_{ij} |y_{N_i} - \hat{y}_{N_j}|_2^2$
LP 使用迭代算法,在对标记节点取固定值的函数空间上最小化这个能量函数。该算法通过未标记节点邻居标签的加权平均值来更新其标签分布。
1.2 标签扩散(Label Spreading,LS)
标签扩散是标签传播的一种变体,它最小化以下能量函数:
$L_{G,RECON}(W, \tilde{W}; \The
超级会员免费看
订阅专栏 解锁全文
4230

被折叠的 条评论
为什么被折叠?



