【深度学习】绘制模型训练曲线（epoch-accuracy），寻找最佳epoch值

原创

已于 2023-10-11 21:24:48 修改 · 3.4w 阅读

331 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言

于 2023-10-11 21:13:27 首次发布

本文介绍了卷积神经网络中的epoch概念，讨论了过拟合和欠拟合风险，并通过实例展示了如何通过epoch-accuracy曲线调整超参数。重点强调了数据增强在提升模型性能中的作用，最终得出60~80个epoch作为最佳实践。

一、什么是epoch

在卷积神经网络（CNN）训练中，"epoch"（周期）是一个重要的概念，表示模型训练过程中数据集的完整遍历次数。通过多次"epoch"，模型逐渐适应训练数据，提高性能，并通过验证性能监测模型的泛化能力。在深度学习中，正确设置"epoch"的数量是一个重要的超参数，需要根据具体问题和数据集来调整。

Epoch设置过大：

过拟合风险：如果 epoch 设置过大，模型有可能过度拟合训练数据，即模型在训练数据上表现得非常好，但在新数据上表现较差。这是因为模型会记住噪声和细节，而不是学习通用规律。
浪费时间和计算资源：较大的 epoch 会占用更多的时间和计算资源，而结果可能不会有显著的提升。这对于大规模深度学习模型来说特别昂贵。

Epoch设置过小：

欠拟合风险：如果 epoch 设置得太小，模型可能无法捕获训练数据中的模式和特征，导致训练不足，模型性能较差。
性能下降：模型需要一定的训练时间才能逐渐学习数据的特征。如果 epoch 设置太小，模型可能没有足够的时间来收敛，导致性能下降。

二、绘制epoch-accuracy（准确性）与epoch-loss（损失值）曲线图，寻找最佳epoch

所用数据文件：点击下载

import torch
from torch.utils.data import Dataset, DataLoader
import numpy as np
from PIL import Image
from torchvision import transforms

# 定义数据预处理的转换
data_transforms = {
    'train':
        transforms.Compose([
            transforms.Resize([256,256]),
            transforms.ToTensor()
        ]),
    'valid':
        transforms.Compose([
            transforms.Resize([256, 256]),
            transforms.ToTensor()
        ]),
}

# 定义自定义的数据集类
class food_dataset(Dataset):  # food_dataset是自己创建的类名称，可以改为你需要的名称
    def __init__(self, file_path, transform=None):  # 类的初始化
        self.file_path = file_path
        self.imgs = []
        sel

最低0.47元/天解锁文章