图论
首先“连通图”很容易理解,比如这个世界每个人做一个节点的话,把相互认识的两人间连一条线,整张图多半可能就是一张连通图。
社交网络中,比如我不想让我github上的朋友你看到我的博客,就不加入外链,而在博客上加入git外链,即建立了单向边。
对于一个连通图G,就产生了两个概念:特征路径步长和聚合系数
特征路径长度(characteristic path length):在网络中,任选两个节点,连通这两个节点的最少边数,定义为这两个节点的路径长度,网络中所有节点对的路径长度的平均值,定义为网络的特征路径长度。这是网络的全局特征。
聚合系数/聚类系数/集聚系数(clustering coefficient):假设某个节点有k条边,则这k条边连接的节点(k个)之间最多可能存在的边的条数为k(k-1)/2,用实际存在的边数除以最多可能存在的边数得到的分数值,定义为这个节点的聚合系数。所有节点的聚合系数的均值定义为网络的聚合系数。聚合系数是网络的局部特征,反映了相邻两个人之间朋友圈子的重合度,即该节点的朋友之间也是朋友的程度。
小世界网络
- 对于规则网络,任意两个点(个体)之间的特征路径长度长,但聚合系数高。
- 对于随机网络,任意两个点之间的特征路径长度短,但聚合系数低。
- 小世界网络,点之间特征路径长度小,接近随机网络,而聚合系数依旧相当高,接近规则网络。
发现规则网络具有很高的聚合系数,大世界(large world,意思是特征路径长度很大),其特征路径长度随着节点数 N 线性增长,而随机网络聚合系数很小,小世界(small world,意思是特征路径长度小),其特征路径长度随着log(N)增长中说明,在从规则网络向随机网络转换的过程中,实际上特征路径长度和聚合系数都会下降,到变成随机网络的时候,减少到最少。但这并不是说大的聚合系数一定伴随着大的路径长度,而小的路径长度伴随着小的聚合系数,小世界网络就