Day 45 Tensorboard使用介绍

原创

已于 2025-09-04 21:54:42 修改 · 338 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#python

于 2025-09-04 21:54:08 首次发布

@浙大疏锦行

知识点回顾：

tensorboard的发展历史和原理
tensorboard的常见操作
tensorboard在cifar上的实战：MLP和CNN模型

tensorborad 是一个可视化工具，可以在运行过程中实时渲染，方便我们根据图来动态调整训练策略

一、tensorboard的基本操作

TensorBoard 是 TensorFlow 自带的一个「可视化工具」，就像给机器学习模型训练过程装了一个「监控屏幕」。你可以用它直观看到训练过程中的数据变化（比如损失值、准确率）、模型结构、数据分布等，不用盯着一堆枯燥的数字看，对新手非常友好。

目前我们需要用到的是以下最经典的几个功能：

1.保存模型结构图

2.保存训练集和验证集的loss变化曲线，无需手动打印

3.保存每一个层结构权重分布

4.保存预测图片的预测信息

核心原理：

1.在训练过程中tensorboard将训练数据和模型结构信息记录到日志文件（.tfevents）文件中。

2.通过本地网页服务来自动读取日志文件中的数据，用图标、图像、文本等形式展现出来。

核心流程：

1.日志目录自动管理

2.记录标量数据（Scalar）:记录每个batch（批次）的损失和准确率，以及每个epoch（轮次）的训练指标

3.可视化模型结构：可以在TensorBoard 界面 GRAPHS 选项卡中查看模型层次结构（卷积层、全连接层等）。

4.可视化图像：展示原始数据、数据增强效果以及错误预测样本。

5.记录权重和梯度直方图：在 HISTOGRAMS 选项卡中查看不同层的参数分布随训练的变化。监控模型参数（如权重 weights）和梯度（grads）的分布变化，诊断训练问题（如梯度消失 / 爆炸）。

6.启动tensorboard

import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
import os
import time

# 设置随机种子以确保结果可复现
torch.manual_seed(42)

# 1. 数据预处理和增强
# 训练集数据增强

最低0.47元/天解锁文章