维基百科类别网络的聚类结构分析
1. 研究背景与目标
在社交网络分析领域,大规模结构社交网络分析一直是研究热点。然而,维基百科类别网络在这方面受到的关注相对较少,目前对它的研究主要集中在基于内容的分析上。
维基百科类别网络主要由各类别组成,若两个类别有一定“相似性”,则它们之间会有边相连。这里的相似性通过两个类别共享的页面数量来体现,即边的权重等于两个类别共同拥有的页面数,权重越高,相似性越强。
维基百科的分类是将文章分配到其逻辑所属的至少一个类别中。随着类别政策的不断完善,维基百科的分类系统有望在长期内得到改进。当一个类别变得非常大时,可能会扩散成更小的类别或子类别,这一现象被称为大类别扩散。
本文的目标是通过识别图中连接良好的组件,来研究维基百科类别网络中类别集群的结构特性,并将这些组件与维基百科类别树进行比较,因为预期属于同一集群的类别在维基百科树中应该具有较高的接近度。
2. 相关工作
网络社交网络分析已成为热门研究领域,特别是在在线社交网络应用的背景下。近期有许多对大规模网络的分析,例如对Twitter社交互动的分析、对YouTube网络性质的研究、通过分析Twitter健康消息对疾病传播的建模、对西班牙社交网络Tuenti结构特性和空间距离的分析,以及对用户浏览行为变化的研究等。
维基百科作为最受欢迎的社交媒体网络之一,也得到了广泛研究。包括对用户协作的分析和预测、从群体决策投票者角度对晋升过程的研究、对编辑行为趋势的调查等。同时,也有对维基百科页面链接结构及其随时间演变的研究,以及将其链接结构与其他类似网站进行比较的研究。此外,还有对图聚类方法的综述,提供了不同图聚类定义和评估聚类质
超级会员免费看
订阅专栏 解锁全文
1428

被折叠的 条评论
为什么被折叠?



