数据增强、网络架构和目标函数这三个关键因素显著决定了对比式方法的聚类性能
数据增强:CGC 通过简单地设计参数不共享的连体编码器并直接扰动嵌入来构建同一顶点的两个增强视图,而无需对图引入任何复杂操作。
网络架构:以前的 GCN 编码器在训练过程中都将变换和聚合操作纠缠在一起,导致时间成本较高。为了解决这个问题,AGE 通过图拉普拉斯滤波器和一个 MLP 在 GCN 中解耦了这两个操作。与 AGE 不同,我们使用两个分离的 MLP 对平滑后的节点属性进行编码,这两个 MLP 具有相同的架构但参数不共享。
目标函数:设计了一种新颖的面向邻居的对比损失,以保持跨视图的结构一致性
第一项迫使节点即使在两个不同视图中也与它们的邻居保持一致,而第二项最小化节点与其非邻居之间的一致性。这种面向邻居的对比目标函数通过保持跨视图结构一致性,增强了我们网络的判别能力,从而提高了聚类性能。
网络框架:
算法流程:
总结:
利用拉普拉斯滤波器可以实现与图卷积操作相同的效果。
利用两个不同参数MLP模型得到的嵌入表示计算他们的相似性。利用目标函数进行优化。最后得到再聚类。