三大部分
网络模型,损失函数,数据
使用GPU训练模型,需要将这三个部分上传到GPU
tip:
网络模型、损失函数都不需要另外赋值,直接 .to(device) 就可以上传到GPU,
但是数据(图片、标注)需要另外转移之后再重新赋值给变量
1. 指定模型在哪个设备上训练,GPU or CPU
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
2. 将模型上传到device
class Net(torch.nn.Module):
def __init__(self):
super(Net,self).__init__()
self.conv1 = torch.nn.Conv2d(1,10,kernel_size=5)
self.conv2 = torch.nn.Conv2d(10, 20, kernel_size=5)
self.pooling = torch.nn.MaxPool2d(2)
self.linear= torch.nn.Linear(320,10)
def forward(self,x): # x:(batch_size,C,W,H) 卷积神经网络的输入是四维张量
batch_size = x.size(0)
x = self.pooling(F.relu(self.conv1(x)))
x = self.pooling(F.relu(self.conv2(x)))
x = x.view(batch_size,-1) # 全连接神经网络的输入是二维张量
# 神经网络的输入必须包含batch_size
x = self.linear(x)
return x # 最后一层不做激活,因为要算交叉熵损失,交叉熵损失中包含了softmax层
model = Net()
# 模型上传到GPU
model.to(device)
3. 将损失函数上传到device
criterion =