PYG教程【三】对Cora数据集进行半监督节点分类

本文介绍如何使用PyG库中的Cora数据集,通过构建GCN模型完成半监督节点分类任务。Cora数据集包含2708个节点,10556条边,7种节点类别。模型采用两层图卷积层,输入维度1433,输出维度分别为16和7。最终在测试集上评估模型准确率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Cora数据集

PyG包含有大量的基准数据集。初始化数据集非常简单,数据集初始化会自动下载原始数据文件,并且会将它们处理成Data格式。

如下图所示,Cora数据集中只有一个图,该图包含2708个节点,10556条边,节点类别数为7,特征维度为1433。并且默认已经对数据集进行了划分,分为了训练集、验证集和测试集。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
然后看看节点特征和标签。x为节点特征矩阵,维度为2708*1433。y为节点标签向量,维度为2708,类别为7。
在这里插入图片描述

用GCN进行半监督节点分类

接下来就可以构建一个简单的GCN模型,在Cora数据集上进行半监督节点分类。

下面的GCN模型包含两个图卷积层。第一层输入维度为1433(节点特征维度),输出为16(与第一层输出一致),后面接上一个relu激活函数,以及dropout操作。第二层输入维度为16,输出为7(节点标签数量),后接log_softmax函数进行分类。

在这里插入图片描述

模型构建完成后,指定训练设备为GPU(没有的话就用CPU),注意这里默认使用的是0号cuda。如果cuda:0被占用了的话会报错,需要指定其他号码的cuda才能运行。然后,分别将GCN模型以及Cora图数据送入指定的设备。

优化器选择Adam,学习率设置为0.01,权重衰减设置为5e-4。这些都配置好以后就可以训练模型了,epoch设为200,每个epoch后清除上次的梯度信息,然后用nll_loss计算出训练集上的损失,调用backward函数计算出梯度后传回给Adam优化器进行参数更新。
在这里插入图片描述
最后在测试集上评估模型,计算分类正确率accuracy并显示。

在这里插入图片描述
至此,就完成了Cora数据集上的节点分类任务了。

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值