PyTorch实现Softmax Classifier处理MNIST数据集

本文介绍了如何用PyTorch实现Softmax分类器来处理MNIST数据集,包括数据预处理、模型设计、损失函数与优化器构造以及训练与测试过程。在数据准备阶段,涉及了图像像素值的转换;模型设计中,通过张量重塑适应全连接层;训练和测试环节,明确了在测试时不需要计算梯度。

Softmax Classifier

1. Prepare Dataset

神经网络希望输入数据最好是在-1到1之间,最好是正态分布,这样训练的效果最好。所以我们需要把图像的像素值进行转换。

from torchvision import transforms
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307, ), (0.3081, ))])

transforms.ToTensor():将图转化为Channel*Width*Height的张量。

transforms.Normalize((0.1307, ), (0.3081, )):前者是均值,后者是标准差(对数据集计算得出)。即使Tensor中的数值符合01分布。

torch.Tensor默认是torch.FloatTensor是32位浮点类型数据,torch.LongTensor是64位整型

import torch
from torchvision import transforms
from torchvision import datasets
from torch.utils.data import DataLoader
import torch.nn.functional as F
import torch.optim as optim

batch_size = 64

transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307, ), (0.3081, ))])

train_dataset = datasets.MNIST(
<think>我们被要求使用PyTorch下载Fashion MNIST数据集并进行分类。根据引用[1],我们可以使用torchvision来加载FashionMNIST数据集,并进行数据归一化处理。同时,引用[2]提到可以使用一个单层的Softmax分类器(实际上,对于图像分类,我们通常使用神经网络,即使是简单的网络也可以)。这里我们将构建一个简单的神经网络模型进行分类。 步骤: 1. 导入必要的库 2. 加载和归一化Fashion MNIST数据集(使用torchvision) 3. 定义神经网络模型 4. 定义损失函数和优化器 5. 训练模型 6. 评估模型性能 注意:Fashion MNIST是一个包含10个类别的服装图片数据集,每张图片大小为28x28灰度图。 下面我们逐步实现: </think> ### 使用PyTorch下载Fashion MNIST并进行分类 以下是完整的实现步骤: #### 1. **导入必要库** ```python import torch import torch.nn as nn import torch.nn.functional as F from torchvision import datasets, transforms import matplotlib.pyplot as plt ``` #### 2. **下载并预处理数据集** ```python # 定义数据转换(归一化+张量转换) transform = transforms.Compose([ transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,)) # 单通道归一化 ]) # 下载训练集和测试集 train_set = datasets.FashionMNIST( '~/.pytorch/F_MNIST_data/', download=True, train=True, transform=transform ) test_set = datasets.FashionMNIST( '~/.pytorch/F_MNIST_data/', download=True, train=False, transform=transform ) # 创建数据加载器 train_loader = torch.utils.data.DataLoader( train_set, batch_size=64, shuffle=True) test_loader = torch.utils.data.DataLoader( test_set, batch_size=64, shuffle=True) ``` #### 3. **定义神经网络模型** ```python class Classifier(nn.Module): def __init__(self): super().__init__() self.fc1 = nn.Linear(784, 256) # 输入层(28*28=784) self.fc2 = nn.Linear(256, 128) # 隐藏层 self.fc3 = nn.Linear(128, 10) # 输出层(10个类别) self.dropout = nn.Dropout(0.2) # 防止过拟合 def forward(self, x): x = x.view(x.shape[0], -1) # 展平图像 x = F.relu(self.fc1(x)) x = self.dropout(x) x = F.relu(self.fc2(x)) x = self.dropout(x) x = F.log_softmax(self.fc3(x), dim=1) return x model = Classifier() ``` #### 4. **训练模型** ```python criterion = nn.NLLLoss() # 负对数似然损失 optimizer = torch.optim.Adam(model.parameters(), lr=0.003) epochs = 10 train_losses = [] for epoch in range(epochs): running_loss = 0 for images, labels in train_loader: optimizer.zero_grad() output = model(images) loss = criterion(output, labels) loss.backward() optimizer.step() running_loss += loss.item() epoch_loss = running_loss/len(train_loader) train_losses.append(epoch_loss) print(f"Epoch {epoch+1}/{epochs} - Loss: {epoch_loss:.4f}") ``` #### 5. **评估模型** ```python correct = 0 total = 0 with torch.no_grad(): for images, labels in test_loader: outputs = model(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() print(f'测试集准确率: {100 * correct / total:.2f}%') ``` #### 6. **可视化结果** ```python # 显示训练损失曲线 plt.plot(train_losses) plt.title('训练损失变化') plt.xlabel('Epochs') plt.ylabel('Loss') plt.show() # 查看测试样本预测 images, labels = next(iter(test_loader)) outputs = model(images) _, preds = torch.max(outputs, 1) # 显示预测结果(前16张) fig, axes = plt.subplots(4, 4, figsize=(12,12)) for i, ax in enumerate(axes.flat): ax.imshow(images[i].view(28,28), cmap='gray') ax.set_title(f'预测: {preds[i]} | 真实: {labels[i]}') ax.axis('off') plt.tight_layout() ``` ### 关键说明 1. **数据预处理**:通过`transforms.Normalize((0.5,), (0.5,))`将像素值从$[0,1]$归一化到$[-1,1]$,加速模型收敛[^1] 2. **网络结构**:使用三层全连接网络,输入层784节点(28×28像素),输出层10节点对应10个类别 3. **正则化**:Dropout层减少过拟合风险 4. **性能预期**:上述代码在测试集上可达约85%准确率
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值