PyG (PyTorch Geometric) Dropbox系图数据集无法下载的解决方案(AMiner, DBLP, IMDB, LastFM)(持续更新ing...)

本文提供了解决PyG官方数据集因Dropbox下载限制而无法获取数据的问题方案。介绍了如何从百度网盘下载所需数据集(包括AMiner、DBLP、IMDB和LastFM),并详细说明了数据集的解压及存放路径。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

诸神缄默不语-个人优快云博文目录

本文主要关注PyG官方提供的数据集中,因为数据下载源是Dropbox,所以不能直接下载的解决方案。
由于优快云无法直接显示百度网盘链接,因此放到了GitHub上:PolarisRisingWar/HGNN_Collection: A Collection for HGNN (Heterogenous Graph Neural Network), including datasets, algorithms and so on.,本篇提及的数据集,目录都在dataset - PyG_Dropbox下。

最近更新时间:2022.9.22
最早更新时间:2022.9.22

1. AMiner

from torch_geometric.datasets import AMiner

dataset = AMiner(root='/data/pyg_data/AMiner')
data = dataset[0]

这个数据集需要下载的两个文件分别是label.zipnet_aminer.zip,我都已放到百度网盘。
下载后将两个压缩文件分别解压,net_aminer.zip解压后得到net_aminer里面的文件都放到root文件夹下新建的raw文件夹,label.zip解压后的文件都放到root文件夹下新建的raw文件夹。

也就是说,最后raw文件夹下需要有这些文件/文件夹:
'id_author.txt', 'id_conf.txt', 'paper.txt', 'paper_author.txt','paper_conf.txt', 'label'

2. DBLP

from torch_geometric.datasets import DBLP

dataset = DBLP(root='/data/pyg_data/DBLP')
data = dataset[0]

这个数据集需要下载的文件是DBLP_processed.zip,我已放到百度网盘。
将文件解压后的文件都放到root文件夹下的raw文件夹即可。

3. IMDB

from torch_geometric.datasets import IMDB

dataset = IMDB(root='/data/pyg_data/IMDB')
data = dataset[0]

这个数据集需要下载的文件是IMDB_processed.zip,我已放到百度网盘。
将文件解压后的文件都放到root文件夹下的raw文件夹即可。

4. LastFM

from torch_geometric.datasets import LastFM

dataset = LastFM(root='/data/pyg_data/LastFM')
data = dataset[0]

这个数据集需要下载的文件是LastFM_processed.zip,我已放到百度网盘。
将文件解压后的文件都放到root文件夹下的raw文件夹即可。

评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

诸神缄默不语

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值