- 这段代码实现了一个基于PyTorch的深度学习模型,主要用于对MNIST手写数字数据集进行分类。代码包含了模型的定义、数据加载、训练过程以及模型评估。
-
代码逐步解释:
- 导入库:
-
import torch from torch import nn,optim from torch.autograd import Variable from torch.utils.data import DataLoader from torchvision import datasets,transforms
- 导入PyTorch相关的库,包括神经网络模块(nn)、优化器(optim)、自动求导(Variable)、数据加载工具(DataLoader)以及图像处理工具(datasets和transforms)。
- 设置超参数:
-
batch_size=64 learning_rate=0.02 num_epoches=100
- 定义批次大小(batch_size)、学习率(learning_rate)和训练轮数(num_epoches)。
- 定义神经网络模型:
-
class Batch_Net(nn.Module): def __init__(self,in_dim,n_hidden_1,n_hidden_2,out_dim): super(Batch_Net,self).__init__() self.layer1=nn.Sequential(nn.Linear(in_dim,n_hidden_1),nn.BatchNorm1d(n_hidden_1),nn.ReLU(True)) self.layer2=nn.Sequential(nn.Linear(n_hidden_1,n_hidden_2),nn.BatchNorm1d(n_hidden_2),nn.ReLU(True)) self.layer3=nn.Sequential(nn.Linear(n_hidden_2,out_dim)) def forward(self,x): x=self.layer1(x) x=self.layer2(x) x=self.layer3(x) return x
- 定义一个名为
Batch_Net
的神经网络类,包含三个层:- 第一层:线性层 + 批归一化 + ReLU激活函数。
- 第二层:线性层 + 批归一化 + ReLU激活函数。
- 第三层:线性层(输出层)。
- 数据预处理:
-
data_tf=transforms.Compose([transforms.ToTensor(),transforms.Normalize([0.5],[0.5])]) train_dataset=datasets.MNIST(root='./data',train=True,transform=data_tf,download=True) test_dataset=datasets.MNIST(root='./data',train=False,transform=data_tf) train_loader=DataLoader(train_dataset,batch_size=batch_size,shuffle=True) test_loader=DataLoader(test_dataset,batch_size=batch_size,shuffle=False)
- 定义数据转换,包括将图像转换为张量并进行归一化。
- 下载并加载MNIST训练集和测试集,并使用DataLoader进行批量加载。
- 初始化模型、损失函数和优化器:
-
model=Batch_Net(28*28,300,100,10) criterion=nn.CrossEntropyLoss() optimizer=optim.SGD(model.parameters(),lr=learning_rate)
- 创建模型实例,指定输入维度、隐藏层维度和输出维度。
- 使用交叉熵损失作为损失函数。
- 使用随机梯度下降(SGD)作为优化器。
- 训练模型:
-
epoch=0 for data in train_loader: img,label=data img=img.view(img.size(0),-1) if torch.cuda.is_available(): img=img.cuda() label=label.cuda() else: img=Variable(img) label=Variable(label) out=model(img) loss=criterion(out,label) print_loss=loss.data.item() optimizer.zero_grad() loss.backward() optimizer.step() epoch+=1 if epoch%100==0: print('epoch: {},loss: {:.4}'.format(epoch,print_loss))
- 遍历训练数据,进行以下步骤:
- 将图像数据展平以适应模型输入。
- 检查是否使用GPU,并相应地将数据转移到GPU。
- 前向传播计算输出。
- 计算损失。
- 清零优化器的梯度。
- 反向传播计算梯度。
- 更新模型参数。
- 每100个epoch打印一次损失。
- 保存模型:
-
torch.save(model.state_dict(), 'batch_net_model.pth')
- 将训练好的模型参数保存到文件中。
- 评估模型:
-
model.eval() eval_loss=0 eval_acc=0 for data in test_loader: img,label=data img = img.view(img.size(0), -1) if torch.cuda.is_available(): img = img.cuda() label = label.cuda() else: img = Variable(img) label = Variable(label) out = model(img) loss = criterion(out, label) eval_loss+=loss.data.item()*label.size(0) _,pred=torch.max(out,1) num_correct=(pred==label).sum() eval_acc+=num_correct.item() print('Test loss: {:.6f},Acc: {:.6f}'.format( eval_loss/(len(test_dataset)),eval_acc/(len(test_dataset))))
- 将模型设置为评估模式,并初始化评估损失和准确率。
- 遍历测试数据,计算损失和准确率,并打印结果。
整体来说,这段代码实现了一个简单的神经网络模型用于MNIST数据集的分类任务,包括数据预处理、模型训练和评估。
完整代码:
import torch
from torch import nn,optim
from torch.autograd import Variable
from torch.utils.data import DataLoader
from torchvision import datasets,transforms
batch_size=64
learning_rate=0.02
num_epoches=100
class Batch_Net(nn.Module):
def __init__(self,in_dim,n_hidden_1,n_hidden_2,out_dim):
super(Batch_Net,self).__init__()
self.layer1=nn.Sequential(nn.Linear(in_dim,n_hidden_1),nn.BatchNorm1d(n_hidden_1),nn.ReLU(True))
self.layer2=nn.Sequential(nn.Linear(n_hidden_1,n_hidden_2),nn.BatchNorm1d(n_hidden_2),nn.ReLU(True))
self.layer3=nn.Sequential(nn.Linear(n_hidden_2,out_dim))
def forward(self,x):
x=self.layer1(x)
x=self.layer2(x)
x=self.layer3(x)
return x
data_tf=transforms.Compose([transforms.ToTensor(),transforms.Normalize([0.5],[0.5])])
train_dataset=datasets.MNIST(root='./data',train=True,transform=data_tf,download=True)
test_dataset=datasets.MNIST(root='./data',train=False,transform=data_tf)
train_loader=DataLoader(train_dataset,batch_size=batch_size,shuffle=True)
test_loader=DataLoader(test_dataset,batch_size=batch_size,shuffle=False)
model=Batch_Net(28*28,300,100,10)
criterion=nn.CrossEntropyLoss()
optimizer=optim.SGD(model.parameters(),lr=learning_rate)
epoch=0
for data in train_loader:
img,label=data
img=img.view(img.size(0),-1)
if torch.cuda.is_available():
img=img.cuda()
label=label.cuda()
else:
img=Variable(img)
label=Variable(label)
out=model(img)
loss=criterion(out,label)
print_loss=loss.data.item()
optimizer.zero_grad()
loss.backward()
optimizer.step()
epoch+=1
if epoch%100==0:
print('epoch: {},loss: {:.4}'.format(epoch,print_loss))
torch.save(model.state_dict(), 'batch_net_model.pth')
model.eval()
eval_loss=0
eval_acc=0
for data in test_loader:
img,label=data
img = img.view(img.size(0), -1)
if torch.cuda.is_available():
img = img.cuda()
label = label.cuda()
else:
img = Variable(img)
label = Variable(label)
out = model(img)
loss = criterion(out, label)
eval_loss+=loss.data.item()*label.size(0)
_,pred=torch.max(out,1)
num_correct=(pred==label).sum()
eval_acc+=num_correct.item()
print('Test loss: {:.6f},Acc: {:.6f}'.format(
eval_loss/(len(test_dataset)),eval_acc/(len(test_dataset))))
结果:
图片测试:
import torch
import cv2
import numpy as np
from torchvision import transforms
from torch import nn
# 定义Batch_Net模型结构
class Batch_Net(nn.Module):
def __init__(self, in_dim, n_hidden_1, n_hidden_2, out_dim):
super(Batch_Net, self).__init__()
self.layer1 = nn.Sequential(nn.Linear(in_dim, n_hidden_1), nn.BatchNorm1d(n_hidden_1), nn.ReLU(True))
self.layer2 = nn.Sequential(nn.Linear(n_hidden_1, n_hidden_2), nn.BatchNorm1d(n_hidden_2), nn.ReLU(True))
self.layer3 = nn.Sequential(nn.Linear(n_hidden_2, out_dim))
def forward(self, x):
x = self.layer1(x)
x = self.layer2(x)
x = self.layer3(x)
return x
# 加载图像
image = cv2.imread('1.jpg')
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# 预处理图像
data_tf = transforms.Compose([
transforms.ToTensor(), # 转换为Tensor
transforms.Normalize([0.5], [0.5]) # 归一化
])
# 将图像调整为28x28,并添加批次维度
gray_image = cv2.resize(gray_image, (28, 28)) # 确保图像大小为28x28
gray_image = data_tf(gray_image).view(1, -1) # 展平并添加批次维度
# 创建模型实例并加载权重
model = Batch_Net(28 * 28, 300, 100, 10)
model.load_state_dict(torch.load('batch_net_model.pth'))
model.eval() # 设置模型为评估模式
# 进行推理
with torch.no_grad(): # 不需要计算梯度
output = model(gray_image)
_, predicted = torch.max(output, 1)
print(f'预测的数字是: {predicted.item()}')