18、社交网络中的分类研究

社交网络中的分类研究

1. 数据集概述

在社交网络分类研究中,常用到Cora、CiteSeer和WebKB这三个数据集,它们的基本信息如下表所示:
| 数据集 | 特征数量 | 节点数量 | 唯一链接数量 | 类别数量 | 平均度 | 直径 | 平均路径长度 | 密度 | 全局聚类系数 | 平均聚类系数 | 幂律指数 | 同质性 |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| Cora | 1433 | 2708 | 5278 | 7 | 3.90 | 19 | 6.31 | 0.0014 | 0.094 | 0.293 | 1.867 | 0.83 |
| CiteSeer | 3703 | 3312 | 4536 | 6 | 2.74 | 28 | 9.30 | 0.0008 | 0.130 | 0.243 | 1.638 | 0.71 |
| WebKB | 1703 | 877 | 1388 | 5 | 3.17 | 8 | 3.14 | 0.0036 | 0.0362 | 0.294 | 1.810 | 0.13 |

CiteSeer数据集包含3312篇科学论文的信息,有3703个在这些论文中至少出现10次的独特单词,论文根据主题被分为六个类别,单词、类别以及引用和被引用信息分别存于两个文件中,论文间的连接总数为4536,每篇论文平均有2.74个链接。

WebKB数据集由四个计算机科学系的网页集合组成,每个网页被手动标记为课程、项目、员工、学生或教师五个类别。其链接结构与Cor

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值