APPNP:PREDICT THEN PROPAGATE: GRAPH NEURAL NETWORKS MEET PERSONALIZED PAGERANK

原创已于 2024-08-29 13:25:19 修改 · 1k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #机器学习 #深度学习

于 2022-05-11 21:25:32 首次发布

人工智能专栏收录该内容

41 篇文章

订阅专栏

APPNP（Approximate Personalized Propagation of Neural Predictions）算法结合了图卷积神经网络与个性化页面排序，用于节点分类任务。该算法解决了传统PageRank在处理自链接和循环圈时的问题，通过引入跳转概率α避免PR值无限增长。APPNP在PPNP基础上进行近似求逆操作，提高模型训练效率。在最后的迭代步骤中，通过归一化操作得到预测结果。此算法在不增加额外参数的情况下，提升了图神经网络的性能，但可能面临收敛速度慢的问题。

背景

发表论文时对应的对比算法。

KLICPERA J, BOJCHEVSKI A, GÜNNEMANN S. Predict then Propagate: Graph Neural Net-
works meet Personalized PageRank[C/OL] //7th International Conference on Learning Represen-
tations, ICLR 2019, New Orleans, LA, USA, May 6-9, 2019. : OpenReview.net, 2019. https:
//openreview.net/forum?id=H1gL-2A9Ym.

理论部分

APPNP (Approximation Personalized Propagation of Neural Prediction)被应用在引文网络的节点分类任务中。在节点分类中，一般的网络方法对领域节点的考虑是不足的。APPNP利用图卷积神经网络与个性化页面排序结合，利用PageRank传播的方式构建一种简单的模型，来进行邻域节点信息更好的传播。PageRank 算法通过网页链接重要性得分计算。重要性可认为是网页链接点击。PageRank算法给定一个概率值，定义为网页访问的概率。一般地， $1N\frac{1}{N}$ 表示为每个网页节点初始化的概率， $PR{\rm{PR}}$ 也是一个初始化的概率值。PageRank 是一个迭代算法，因此 $PR{\rm{PR}}$ 值初始化为 $1N\frac{1}{N}$ ， $N$ 表示为节点的数量。 $PR{\rm{PR}}$ 值的总和一般为1，当 $PR{\rm{PR}}$ 越大，说明重要性越大。
给定节点 $v$ ，求节点 $v$ 的 $PR{\rm{PR}}$ 值，
${\rm{PR(}}v{\rm{) = }}\sum\limits_{u \in {{\mathcal N}_v}} {\frac{{{\rm{PR(}}u{\rm{)}}}}{{O(u)}}}$
$Nv{{\mathcal N}_v}$ 表示所有链接到节点 $v$ 的集合。 $O (u)$ 表示节点 $u$ 的对外链接数。最早提出的PageRank算法存在着一些缺点，例如当一些节点存在自链接，或者是一些节点的出链节点形成循环圈时，PageRank在迭代过程中会出现 $PR{\rm{PR}}$ 持续增大，不会减小的情况。对于上述问题，PageRank算法被重新进行改进。
${\rm{PR(}}v{\rm{) = }}\alpha \sum\limits_{u \in {{\mathcal N}_v}} {\frac{{{\rm{PR(}}u{\rm{)}}}}{{O(u)}}} + \frac{{(1 - \alpha )}}{N}$
$α\alpha$ 是一个超参数，取值一般为0.85。 $α\alpha$ 表示节点跳转时的概率，不依据节点之间的链接进行跳转。
PageRank算法衍生出的模型个性化的PageRank算法，主要利用图中节点的链接关系来迭代计算节点的权重。PageRank算法使用随机游走的策略来访问图中节点。PageRank算法与个性化Page Rank算法的区别在于随机游走时的跳转行为不同。个性化的PageRank算法对跳转行为进行约束，指定调转到的对外链接为特定的节点。例如在个性化排序时，用户只能跳转到一些特定的节点，这些节点表示用户偏好的那些节点。
${\rm{PP}}{{\rm{R}}^{'}}{\rm{(}}v{\rm{) = }}\alpha \sum\limits_{u \in {{\mathcal N}_v}} {\frac{{{\rm{PR(}}u{\rm{)}}}}{{O(u)}}} + (1 - \alpha )r_v$
其中，
${r_v} = \left\{ {\begin{matrix}{{}} 1&{v = u}\\ 0&{v \ne u} \end{matrix}} \right.$
个性化PageRank算法中，用户的偏好表示为 $r_v| = 1$ 。原始的PageRank采用的计算方式为 $ρpr=Arwρpr{{\boldsymbol{\rho }}_{{\rm{pr}}}} = {{\bf{A}}_{{\rm{rw}}}}{{\boldsymbol{\rho }}_{{\rm{pr}}}}$ ， $ρpr{{\boldsymbol{\rho }}_{{\rm{pr}}}}$ 是 $Arw{{\bf{A}}_{{\rm{rw}}}}$ 的特征向量， $Arw=AD−1{{\bf{A}}_{{\rm{rw}}}} = {\bf{A}}{{\bf{D}}^{ - 1}}$ ，类似的，个性化的PageRank 算法可以表示为
${{\boldsymbol{\rho }}_{{\rm{ppr}}}}({{\bf{x}}_{\bf{v}}}) = (1 - \alpha ){\bf{\tilde A}}{{\boldsymbol{\rho }}_{{\rm{ppr}}}}({{\bf{x}}_{\bf{v}}}) + \alpha {{\bf{x}}_{\bf{v}}}$
对上式进行重新表示，得到
${{\boldsymbol{\rho }}_{{\rm{ppr}}}}({{\bf{x}}_{\bf{v}}}) = \alpha {({\bf{I}} - (1 - \alpha ){\bf{\tilde A}})^{ - 1}}{{\bf{x}}_{\bf{v}}}$
$xv{{\bf{x}}_{\bf{v}}}$ 表示的是节点 $v$ 对应的传送向量。
PPNP模型的输出结果可表示为 $ZPPNP{{\bf{Z}}_{{\rm{PPNP}}}}$
${{\bf{Z}}_{{\rm{PPNP}}}}{\rm{ = softmax(}}\alpha {({\bf{I}} - (1 - \alpha ){\bf{\tilde A}})^{ - 1}}{f_w}{\rm{(}}{\bf{X}}{\rm{))}}$

$fw(X){f_w}{\rm{(}}{\bf{X}}{\rm{)}}$ 表示的是一个关于参数学习权重 $w$ 的神经网络。 $A~=D^−12A^D^−12{\bf{\tilde A}} = {{\bf{\hat D}}^{^{ - \frac{1}{2}}}}{\bf{\hat A}}{{\bf{\hat D}}^{^{ - \frac{1}{2}}}}$ ， $A^=A+I{\bf{\hat A}} = {\bf{A}} + {\bf{I}}$ 。为加快PPNP的网络模型训练速度，因此APPNP在PPNP的基础上近似求逆的操作。被表示为：
${\bf{Z}}_{{\rm{APPNP}}}^{(0)}{\rm{ = }}{f_w}{\rm{(}}{\bf{X}}{\rm{)}}$

${\bf{Z}}_{{\rm{APPNP}}}^{k + 1}{\rm{ = (1 - }}\alpha {\rm{)}}{\bf{\tilde AZ}}_{{\rm{APPNP}}}^k + \alpha {f_w}{\rm{(}}{\bf{X}}{\rm{)}}$

${\bf{Z}}_{{\rm{APPNP}}}^K{\rm{ = softmax}}({\rm{(1 - }}\alpha {\rm{)}}{\bf{\tilde AZ}}_{{\rm{APPNP}}}^{K - 1} + \alpha {f_w}{\rm{(}}{\bf{X}}{\rm{))}}$

通过上述公式，矩阵的求逆操作被进行近似。在APPNP迭代到最后两步时，进行归一化操作。 $\in K$ ， $K$ 表示迭代的次数。
个性化的页面排序算法加入 $α\alpha$ ，表示节点跳转时依据一定的概率，使页面排序算法具有个性化。
APPNP算法利用图卷积神经网络与页面排序算法结合的方式，提出一种个性化页面排序算法解决图神经网络节点分类问题的模型。相比于一些基线模型，APPNP算法没有引入任何的参数量，但APPNP的算法收敛速度较慢。APPNP算法将个性化页面排序算法与图卷积神经网络结合，图卷积神经网络可以被替换为图注意力网络等。

理论部分注意事项

$πpr=Arwπpr{{\boldsymbol{\pi}}_{{\rm{pr}}}} = {{\bf{A}}_{{\rm{rw}}}}{{\boldsymbol{\pi }}_{{\rm{pr}}}}$
$πpr{{\boldsymbol{\pi}}_{{\rm{pr}}}}$ 应该是 $Arw{{\bf{A}}_{{\rm{rw}}}}$ 的特征向量。参考链接来自：