一、网络和社区
我们通常认为网络的结构是这样的:

那么是什么导致了这样的预期呢?
网络中的数据流是如何流动的?
不同结构的节点扮演了什么怎样不同的角色?
不同的链接(长与短)又分别扮演了什么怎样不同的角色?
在1960年Mark Granovetter对人们通过人际关系获取信息的研究中发现,人们通常经由不那么熟悉的人的介绍来获取工作。为什么这样的介绍人会比熟人更有帮助?
关于友谊关系的两个观点:
- 结构上,友谊关系遍布网络的不同部分
- 在人与人交往时,友谊不是弱就是强
而结构上,如果两个人都有一个共同的朋友,则会使他们成为朋友的概率上升,这被称为三角闭合(Triadic closure)。

在此基础上,Granovetter阐述了一条边在人际上的角色和结构上的角色之间的关系。
第一,结构上强的边在人际上也强,跨越网络不同部分的长边在人际上很弱。
第二,长边容许你获取网络中其他部分的信息,从而找到工作,从结构上看强的边在信息交流方面是严重冗余的。

三角闭合既为聚类系数较高。
二、边的重复
定义O_ij衡量连接节点 i 和节点 j 之间是否有其他的边与{i, j}其相重复。

其中N为节点的邻居数。

从对手机网络的分析中可以看到在真实网络中,边的权重和重复度正相关。

将真实网络中的边,从高权重到低权重删除,与从低权重到高权重删除进行对比,可以看到高权重边在维持网络流通性方面较低权重边更重要。

本文探讨了网络结构的特性,包括数据流的流动方式、节点和链接的角色,以及Mark Granovetter的社会网络理论。深入分析了社区定义及其识别方法,如Modularity(模块度)和Louvain算法,并介绍了重叠社区发现的BigCLAM算法。
最低0.47元/天 解锁文章
283

被折叠的 条评论
为什么被折叠?



