挖掘DBLP作者合作关系,FP-Growth算法实践(4):挖掘每个会议的核心研究者



在只有【论文标题、发布时间、作者、会议名称】这四种信息的情况下,首先提取出所有这四种信息

代码产生的结果如下,数据结构类似于headerTable,看结果就知道了,不再介绍:

authorDict={} #{authorName: total(frequence, startYear, endYear), {eachConf(frequence, startYear, endYear)}}

    authorDict, conferenceDict=CountAuthorAndConferenceFrequence(tranDB)
    print len(authorDict) #31886
    print authorDict["Ying Wu"]
    #[51, 2000, 2015, {'KDD': [1, 2007, 2007], 'SDM': [1, 2005, 2005], 'CVPR': [49, 2000, 2015]}]
    print conferenceDict
    #{'CVPR': 7722, 'PAKDD': 1760, 'ICML': 1111, 'KDD': 2360, 'COLT': 736, 'ICDM': 3873, 'DMKD': 47, 'SIGIR': 2772, 'ECML/PKDD': 1036, 'SDM': 1156, 'WSDM': 618, 'NIPS': 3852}

代码为:

def CountAuthorAndConferenceFrequence(tranDB):
    authorDict={} #{authorName: total(frequence, startYear, endYear), {eachConf(frequence, startYear, endYear)}}
  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值