动手学深度学习——2. HelloWorld_jupyter train-images-idx3-ubyte.gz放在哪个文件夹-优快云博客

本文链接：https://blog.youkuaiyun.com/LEO_Angel01/article/details/115097478

动手学深度学习——2. HelloWorld

记录一下学习深度学习的一些。本篇简述如何在Windows上完成深度学习的HelloWorld——MNIST。
所使用的平台：

Windows 10
8700K
GeForce RTX 2070
CUDA 10.1

MNIST

MNIST 是一个手写数字的数据集，图像为 28*28 的黑白数字图像，60,000 个训练样本，10,000 个测试样本。

下载地址：

Homepage
百度网盘：0e3v

HelloWorld

激活 torch 环境

conda activate torch

安装 jupyterlab，不安装也可，直接执行 python 脚本即可。

conda install -c conda-forge jupyterlab

启动 jupyterlab

jupyter lab

解压 MNIST

import os
import gzip

mnist_dir = "./data" # 下载的MNIST的文件夹路径
X_train_fpath = os.path.join(mnist_dir, "train-images-idx3-ubyte.gz")
Y_train_fpath = os.path.join(mnist_dir, "train-labels-idx1-ubyte.gz")
X_test_fpath = os.path.join(mnist_dir, "t10k-images-idx3-ubyte.gz")
Y_test_fpath = os.path.join(mnist_dir, "t10k-labels-idx1-ubyte.gz")
with gzip.open(X_train_fpath, 'rb') as f:
    X_train_content = f.read()
with gzip.open(Y_train_fpath, 'rb') as f:
    Y_train_content = f.read()
with gzip.open(X_test_fpath, 'rb') as f:
    X_test_content = f.read()
with gzip.open(Y_test_fpath, 'rb') as f:
    Y_test_content = f.read()

查看训练样本和标签

import random
import numpy as np
import matplotlib.pyplot as plt

X_train = []
Y_train = []

for i in range(16, X_train_bytes, num_pixels):
    # 读取784个字节并转换为numpy数组形式，再reshape为28*28
    ndata = np.frombuffer(X_train_content[i:i+num_pixels], dtype=np.uint8).reshape(28,28,1)
    X_train.append(ndata)
    
for i in range(8, Y_train_bytes):
    Y_train.append(Y_train_content[i])

X_train = np.array(X_train)
Y_train = np.array(Y_train)

# 随机挑选8个看一下
choices = random.sample(range(X_train_images), 8)
labels = Y_train[choices]
print(choices)
for i in range(8):
    plt.subplot(2, 4, i+1)
    plt.imshow(X_train[choices[i]], cmap='gray')
    plt.title("{i}".format(i=labels[i]))
plt.show()

data

将训练集划分为训练集和验证集，比例 7:3

X_train, X_val, Y_train, Y_val = train_test_split(X_train, Y_train, test_size=0.3, random_state=123)

网络结构

Net(
  (conv1): Conv2d(1, 32, kernel_size=(3, 3), stride=(1, 1))
  (conv2): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1))
  (dropout1): Dropout(p=0.25, inplace=False)
  (fc1): Linear(in_features=9216, out_features=128, bias=True)
  (dropout2): Dropout(p=0.5, inplace=False)
  (fc2): Linear(in_features=128, out_features=10, bias=True)
)

训练

import time
import copy
from torch.optim import Adam, lr_scheduler

os.environ['CUDA_LAUNCH_BLOCKING'] = '1'
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model = net.to(device)
criterion = nn.CrossEntropyLoss()
optimizer = Adam(model.parameters(), lr=1e-3)
epochs = 10

since = time.time()
best_model_wts = copy.deepcopy(model.state_dict())
best_acc = 0.0
for epoch in range(epochs):
    print('Epoch {}/{}'.format(epoch, epochs - 1))
    print('-' * 10)

    for phase in ['train', 'val']:
        if phase == 'train':
            print('train')
            model.train()
        else:
            model.eval()

        running_loss = 0.0
        running_corrects = 0

        for inputs, labels in dataloaders[phase]:
            inputs = inputs.to(device)
            labels = labels.to(device)

            optimizer.zero_grad()

            # forward
            with torch.set_grad_enabled(phase == 'train'):
                outputs = model(inputs)
                _, preds = torch.max(outputs, 1)
                loss = criterion(outputs, labels)

                # backward
                if phase == 'train':
                    loss.backward()
                    optimizer.step()
            # statistics
            running_loss += loss.item() * inputs.size(0)
            running_corrects += torch.sum(preds == labels.data)

        epoch_loss = running_loss / dataset_sizes[phase]
        epoch_acc = running_corrects.double() / dataset_sizes[phase]
        print('{} Loss: {:.4f} Acc: {:.4f}'.format(phase, epoch_loss, epoch_acc))
        if phase == 'val' and epoch_acc > best_acc:
            best_acc = epoch_acc
            best_model_wts = copy.deepcopy(model.state_dict())
    print()
time_elapsed = time.time() - since
print('Training complete in {:.0f}m {:.0f}s'.format(time_elapsed // 60, time_elapsed % 60))
print('Best val Acc: {:4f}'.format(best_acc))

Epoch 0/9
----------
train Loss: 0.3989 Acc: 0.8779
val Loss: 0.0908 Acc: 0.9709

Epoch 1/9
----------
train Loss: 0.1342 Acc: 0.9610
val Loss: 0.0652 Acc: 0.9798

Epoch 2/9
----------
train Loss: 0.0968 Acc: 0.9708
val Loss: 0.0534 Acc: 0.9841

Epoch 3/9
----------
train Loss: 0.0826 Acc: 0.9757
val Loss: 0.0430 Acc: 0.9871

Epoch 4/9
----------
train Loss: 0.0707 Acc: 0.9790
val Loss: 0.0438 Acc: 0.9876

Epoch 5/9
----------
train Loss: 0.0598 Acc: 0.9815
val Loss: 0.0417 Acc: 0.9882

Epoch 6/9
----------
train Loss: 0.0552 Acc: 0.9831
val Loss: 0.0418 Acc: 0.9876

Epoch 7/9
----------
train Loss: 0.0489 Acc: 0.9849
val Loss: 0.0434 Acc: 0.9865

Epoch 8/9
----------
train Loss: 0.0446 Acc: 0.9856
val Loss: 0.0397 Acc: 0.9891

Epoch 9/9
----------
train Loss: 0.0409 Acc: 0.9865
val Loss: 0.0374 Acc: 0.9887

Training complete in 0m 42s
Best val Acc: 0.989111

测试

# 读取最佳权重
model.load_state_dict(best_model_wts)
model.eval()

with torch.no_grad():
    for inputs, labels in test_dataloader:
        inputs = inputs.to(device)
        labels = labels.to(device)
        outputs = model(inputs)
        _, preds = torch.max(outputs, 1)
        corrects += torch.sum(preds == labels.data)
print("Test Acc: {:.4f}".format(corrects.double() / total))