利用BDS进行社交互联场景爬取的经验
在社交网络研究中,BDS(Bridge - Driven Search)是一种专门为社交互联系统(SIS)设计的爬取策略。它在穿越不同社交网络方面展现出了强大的能力,克服了传统爬取策略的诸多弊端,并且在社交网络内部的爬取中也表现良好。下面我们将详细介绍利用BDS进行的一系列实验及相关发现。
实验设置
为了研究桥梁(bridges)和SIS的主要特征,我们使用BDS收集了十个样本,并对每个样本进行了各项调查,然后将所有样本的结果进行平均。
桥梁和非桥梁节点度的分布
- CDF分析 :通过计算桥梁和非桥梁节点度的累积分布函数(CDF),我们发现对于任意给定的度(d),桥梁节点拥有超过(d)个联系人的概率高于非桥梁节点。这表明平均而言,桥梁节点的联系人数量多于非桥梁节点。
- 幂律分布验证 :观察CDF趋势,我们推测桥梁和非桥梁节点的度遵循幂律分布。为了验证这一猜想,我们绘制了概率分布函数(PDF),并使用最大似然法计算了最佳幂律拟合。结果显示,幂律系数估计和低的Kolmogorov - Smirnov拟合优度指标证实了我们的猜想。
| 类型 | ˛ | D |
| ---- | ---- | ---- |
| 非桥梁节点 | 2.18 | 0.09 |
| 桥梁节点 | 2.31 | 0.15 | - 平均度和标准差分析 :我们计算了SIS中每个社交网络的桥梁和非桥梁节点的平均度和标准差。结果表明,桥梁和非桥梁节点的标准差