基于FP-Growth的频繁项集挖掘与基于社交图的关联规则挖掘
一、任务简介
本次挖掘任务有三个:第一,发掘各个会议的“核心”研究者,具体包括在相应会议上的发表文章数量、活跃时间范围等;第二,挖掘作者之间的合作关系,并使用一定的权值表示合作的紧密程度;第三,挖掘导师-学生关系。
二、数据集
数据来自DBLP的十二个会议从2000年至今的所有论文,十二个会议分别是:{"SDM":1, "ICDM":1, "ECML/PKDD":1, "PAKDD":1, "WSDM":1, "DMKD":1, "CVPR":1, "ICML":1, "NIPS":1, "COLT":1, "SIGIR":1,&

本文介绍了使用FP-Growth算法挖掘DBLP数据中作者合作关系的过程,包括发掘会议核心研究者、挖掘作者合作和导师-学生关系。通过规则和关联分析,得出作者的频繁合作项集,并进行人工验证。
最低0.47元/天 解锁文章
2764

被折叠的 条评论
为什么被折叠?



