社交网络多目标社区检测:基于图数据库支持的NSGA - II方法
社交网络社区检测的重要性与挑战
社交网络吸引了数十亿用户,它由一组通过互连关系连接的对象组成,这些对象可以是用户、群组和页面,互连关系则包括共同兴趣、好友状态或页面访问等社交关系。社交网络中的社区检测旨在识别网络内的社区结构,将网络数据(节点)根据内在相似性划分为不同的集群。这对于组织来说非常重要,因为它可以帮助组织根据社区倾向提供有针对性的服务,在社交网络分析中,还能使营销针对特定用户群体。
然而,目前许多社区检测方法存在一些问题。现有的算法在处理包含大量高度连接数据的网络时,往往会遇到可扩展性问题。而且,社区的定义本身就需要一种多目标的方法,即同时考虑社区的外部和内部连接。以往的研究主要集中在使用模块化指标来评估社区结构的质量,但仅以模块化作为唯一目标常常会导致分辨率有限和不平衡的问题。
相关工作回顾
- K - means聚类算法 :该算法常用于将节点划分为预定义数量的非重叠集群,但在处理社交网络数据时存在困难。一方面,很难提前确定合适的k值;另一方面,“均值”的定义将应用领域限制在数值变量上,而社交网络数据中的关系(如“是朋友”或“关注”)难以用合适的数值表示。
- 传播聚类算法 :以标签传播算法(LPA)为代表,利用图中节点之间的“消息传递”概念来识别社区结构。节点根据其大多数邻居的标签被分配相同的标签,以此推断其所属社区。这类算法速度极快,且对网络拓扑的了解要求较低,但在实践中往往难以识别接近最优的社区。
- 进化计算(EC)算法
超级会员免费看
订阅专栏 解锁全文
2487

被折叠的 条评论
为什么被折叠?



