比赛地址:常规赛:论文引用网络节点分类:
https://aistudio.baidu.com/aistudio/competition/detail/59
数据
-
数据描述
本次赛题数据集由学术网络图构成,该图会给出每个节点的特征,以及节点与节点间关系(训练集节点的标注结果已给出)。 -
数据集简介:
1.学术网络图数据:
该图包含1647958条有向边,130644个节点,参赛者报名成功后即可通过比赛数据集页面提供edges.csv以及feat.npy下载并读取数据。图上的每个节点代表一篇论文,论文从0开始编号;图上的每一条边包含两个编号,例如 3,4代表第3篇论文引用了第4篇论文。图构造可以参照AiStudio上提供的基线系统项目了解数据读取方法。
2.训练集与测试集:
训练集的标注数据有70235条,测试集的标注数据有37311条。训练数据给定了论文编号与类别,如3,15 代表编号为3的论文类别为15。测试集数据只提供论文编号,不提供论文类别,需要参赛者预测其类别。 -
具体数据介绍

本文探讨了常规赛中的一项任务——论文引用网络的节点分类。提供了比赛链接及数据集详情,数据包括1647958条有向边和130644个节点,每个节点代表一篇论文。训练集有70235条标注,测试集有37311条。基线系统采用PGL进行节点分类,详细代码逻辑可在大神修改版中查看。
订阅专栏 解锁全文
457

被折叠的 条评论
为什么被折叠?



