基于FP-Growth的频繁项集挖掘与基于社交图的关联规则挖掘
一、任务简介
本次挖掘任务有三个:第一,发掘各个会议的“核心”研究者,具体包括在相应会议上的发表文章数量、活跃时间范围等;第二,挖掘作者之间的合作关系,并使用一定的权值表示合作的紧密程度;第三,挖掘导师-学生关系。
二、数据集
数据来自DBLP的十二个会议从2000年至今的所有论文,十二个会议分别是:{"SDM":1, "ICDM":1, "ECML/PKDD":1, "PAKDD":1, "WSDM":1, "DMKD":1, "CVPR":1, "ICML":1, "NIPS":1, "COLT":1, "SIGIR":1,&