社交网络:洞察人群行为的关键
1. 社交网络数据来源与潜力
在当今数字化时代,社交网络数据的来源广泛。虽然像 Facebook 这类在线社交网络服务蕴含着大量数据,但目前科学研究更多依赖传统调查方法。全球至少四分之一的互联网用户(超五亿人)使用在线社交网络服务,这是一个尚未充分挖掘的巨大数据宝库。以 Facebook 为例,它占据了人们大量的上网时间,理应成为社会数据的重要来源。
2. 社交网络基础概念
从理论上讲,社交网络研究最初源于对人群网络的模拟。这里涉及到图论,但并非传统数学意义上的函数图。在社交网络中,图是一组相互连接的事物,被连接的事物称为节点或顶点,连接节点的线有时被称为图的边。网络可以代表许多现实世界的对象,如计算机网络、道路网络、电路网络等。而社交网络则聚焦于人与人之间通过家庭、朋友、业务或其他关系建立的连接。
随着网络规模的增大,其数学复杂度迅速增加。理论上,网络中可能的连接数等于 (n² – n)/2,其中 n 是网络中的节点数。例如,10 个人的网络有 45 种可能连接,1000 个人则约有五十万种可能连接。但现实中的网络只包含部分可能连接,且社交网络中的连接并非随机或均匀的,具有以下特点:
- 同质性 :人们通常倾向于与具有相似属性的人建立联系。
- 连接数量差异 :有些人有大量连接,而有些人连接较少。
- 传递性 :若 John 与 Bill 和 Ben 是朋友,那么 Bill 和 Ben 成为朋友的可能性比他们没有共同朋友时更高。
- 聚类现象
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



