【深度学习】绘制模型训练曲线(epoch-accuracy),寻找最佳epoch值

本文介绍了卷积神经网络中的epoch概念,讨论了过拟合和欠拟合风险,并通过实例展示了如何通过epoch-accuracy曲线调整超参数。重点强调了数据增强在提升模型性能中的作用,最终得出60~80个epoch作为最佳实践。

一、什么是epoch

在卷积神经网络(CNN)训练中,"epoch"(周期)是一个重要的概念,表示模型训练过程中数据集的完整遍历次数。通过多次"epoch",模型逐渐适应训练数据,提高性能,并通过验证性能监测模型的泛化能力。在深度学习中,正确设置"epoch"的数量是一个重要的超参数,需要根据具体问题和数据集来调整。

Epoch设置过大

  • 过拟合风险:如果 epoch 设置过大,模型有可能过度拟合训练数据,即模型在训练数据上表现得非常好,但在新数据上表现较差。这是因为模型会记住噪声和细节,而不是学习通用规律。

  • 浪费时间和计算资源:较大的 epoch 会占用更多的时间和计算资源,而结果可能不会有显著的提升。这对于大规模深度学习模型来说特别昂贵。

Epoch设置过小

  • 欠拟合风险:如果 epoch 设置得太小,模型可能无法捕获训练数据中的模式和特征,导致训练不足,模型性能较差。

  • 性能下降:模型需要一定的训练时间才能逐渐学习数据的特征。如果 epoch 设置太小,模型可能没有足够的时间来收敛,导致性能下降。

二、绘制epoch-accuracy(准确性)与epoch-loss(损失值)曲线图,寻找最佳epoch

所用数据文件:点击下载

import torch
from torch.utils.data import Dataset, DataLoader
import numpy as np
from PIL import Image
from torchvision import transforms

# 定义数据预处理的转换
data_transforms = {
    'train':
        transforms.Compose([
            transforms.Resize([256,256]),
            transforms.ToTensor()
        ]),
    'valid':
        transforms.Compose([
            transforms.Resize([256, 256]),
            transforms.ToTensor()
        ]),
}

# 定义自定义的数据集类
class food_dataset(Dataset):  # food_dataset是自己创建的类名称,可以改为你需要的名称
    def __init__(self, file_path, transform=None):  # 类的初始化
        self.file_path = file_path
        self.imgs = []
        sel
### 绘制机器学习模型训练曲线Python 中,可以使用 **Matplotlib** 或者 **TensorBoard** 来绘制机器学习模型训练曲线。以下是两种方法的具体说明: #### 使用 Matplotlib 绘制训练曲线 通过提取不同模型训练损失并将其存储到相应的列表中,可以利用 `matplotlib` 库在同一张图表上绘制多条 Loss-Epoch 曲线进行比较[^2]。 下面是一个简单的代码示例来展示如何实现这一点: ```python import matplotlib.pyplot as plt # 假设我们有三个模型训练损失数据 model1_loss = [0.8, 0.6, 0.4, 0.3, 0.2] model2_loss = [0.9, 0.7, 0.5, 0.3, 0.1] model3_loss = [1.0, 0.8, 0.6, 0.4, 0.2] epochs = range(1, len(model1_loss)+1) plt.figure(figsize=(10, 6)) plt.plot(epochs, model1_loss, label="Model 1", marker='o') plt.plot(epochs, model2_loss, label="Model 2", marker='s') plt.plot(epochs, model3_loss, label="Model 3", linestyle="--") plt.title("Training Loss over Epochs") plt.xlabel("Epochs") plt.ylabel("Loss") plt.legend() plt.grid(True) plt.show() ``` 此代码片段展示了如何将多个模型训练过程中的损失变化情况可视化,并且可以通过调整颜色、标记样式等方式使图形更易于区分和理解。 #### 使用 TensorBoard 进行训练曲线的可视化 对于深度学习项目来说,尤其是基于 PyTorch 构建的模型,推荐使用 **TensorBoard** 工具来进行更为复杂的日志记录与数据分析工作[^3]。它不仅可以跟踪标量(如 loss 和 accuracy),还可以显示其他类型的媒体文件,例如图像、音频甚至嵌入向量空间等复杂结构化信息。 要启用 TensorBoard 支持,在训练循环内部定期写入所需指标至 SummaryWriter 对象即可完成设置。例如: ```python from torch.utils.tensorboard import SummaryWriter writer = SummaryWriter() for epoch in range(num_epochs): train_loss = ... # 计算当前轮次下的平均loss writer.add_scalar('Loss/train', train_loss, epoch) writer.close() ``` 运行上述脚本之后启动命令行工具输入 `tensorboard --logdir=runs` 即可打开浏览器界面查看动态更新的结果图表。 综上所述,如果只是简单地想观察几个固定周期内的性能差异,则可以直接采用 Matplotlib 方法快速生成静态图片;而对于需要长期监控以及交互式探索场景下则更适合选用功能强大的 TensorBoard 解决方案。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值