基于自适应集成网络拓扑和节点内容的自编码器社区检测
1. 引言
在现实世界中,存在着大量的网络数据集,如社交网络、通信网络和参考网络等,它们通常用复杂网络来表示。对于复杂网络的分析,找到由密集连接节点组成的社区非常重要。在社交网络分析中,社区检测有助于发现具有相似兴趣和目的的用户群体,并预测社区内用户的行为。
目前已经提出了许多社区检测方法,大致可分为两类:
- 仅考虑网络拓扑的方法 :包括非负矩阵分解方法、基于模块化的方法和基于概率模型的方法等。然而,现实世界中存在大量的非线性关系,这些方法无法处理非线性关系。虽然人工神经网络(ANN)可以解决这个问题,并且最近自编码器已应用于社区检测任务并取得了不错的结果,但当网络拓扑存在噪声或缺失时,传统方法和仅使用链接的自编码器方法性能不佳。
- 集成网络拓扑和节点内容的方法 :一些方法开始尝试将拓扑和内容信息结合起来进行社区检测。但现实网络中存在一个固有问题,即网络拓扑和内容之间的不匹配,这限制了这些方法的性能。例如,在社交网络中,拓扑和内容的不匹配是很常见的。
为了解决这个问题,本文提出了一种基于自编码器的自适应方法——自适应图正则化自编码器(AAGR)。该方法引入了一个新颖的自适应参数,以在拓扑和内容信息存在社区模式不匹配时,实现对这两种信息的鲁棒集成。
2. 自适应集成链接和节点内容的社区检测框架
考虑一个带属性的图 $G = (V, E, F)$,其中 $V$ 是节点集 ${v_1, v_2, \ldots, v_N}$,$E$ 是边集,$F$ 是节点的特征向量集。网络拓扑用邻接矩阵 $A