CS244W: Machine Learning with Graphs (4) ——网络中的社区结构

本文探讨了网络结构的特性,包括数据流的流动方式、节点和链接的角色,以及Mark Granovetter的社会网络理论。深入分析了社区定义及其识别方法,如Modularity(模块度)和Louvain算法,并介绍了重叠社区发现的BigCLAM算法。

一、网络和社区
我们通常认为网络的结构是这样的:
在这里插入图片描述
那么是什么导致了这样的预期呢?
网络中的数据流是如何流动的?
不同结构的节点扮演了什么怎样不同的角色?
不同的链接(长与短)又分别扮演了什么怎样不同的角色?
在1960年Mark Granovetter对人们通过人际关系获取信息的研究中发现,人们通常经由不那么熟悉的人的介绍来获取工作。为什么这样的介绍人会比熟人更有帮助?

关于友谊关系的两个观点:

  • 结构上,友谊关系遍布网络的不同部分
  • 在人与人交往时,友谊不是弱就是强

而结构上,如果两个人都有一个共同的朋友,则会使他们成为朋友的概率上升,这被称为三角闭合(Triadic closure)。
在这里插入图片描述
在此基础上,Granovetter阐述了一条边在人际上的角色和结构上的角色之间的关系。
第一,结构上强的边在人际上也强,跨越网络不同部分的长边在人际上很弱。
第二,长边容许你获取网络中其他部分的信息,从而找到工作,从结构上看强的边在信息交流方面是严重冗余的。
在这里插入图片描述
三角闭合既为聚类系数较高。
 
 
二、边的重复
定义O_ij衡量连接节点 i 和节点 j 之间是否有其他的边与{i, j}其相重复。
在这里插入图片描述
其中N为节点的邻居数。
在这里插入图片描述
从对手机网络的分析中可以看到在真实网络中,边的权重和重复度正相关。
在这里插入图片描述
将真实网络中的边,从高权重到低权重删除,与从低权重到高权重删除进行对比,可以看到高权重边在维持网络流通性方面较低权重边更重要。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值