- tensorboard的发展历史和原理
- tensorboard的常见操作
- tensorboard在cifar上的实战:MLP和CNN模型
tensorborad 是一个可视化工具,可以在运行过程中实时渲染,方便我们根据图来动态调整训练策略
一、tensorboard的基本操作
TensorBoard 是 TensorFlow 自带的一个「可视化工具」,就像给机器学习模型训练过程装了一个「监控屏幕」。你可以用它直观看到训练过程中的数据变化(比如损失值、准确率)、模型结构、数据分布等,不用盯着一堆枯燥的数字看,对新手非常友好。
目前我们需要用到的是以下最经典的几个功能:
1.保存模型结构图
2.保存训练集和验证集的loss变化曲线,无需手动打印
3.保存每一个层结构权重分布
4.保存预测图片的预测信息
核心原理:
1.在训练过程中tensorboard将训练数据和模型结构信息记录到日志文件(.tfevents)文件中。
2.通过本地网页服务来自动读取日志文件中的数据,用图标、图像、文本等形式展现出来。
核心流程:
1.日志目录自动管理
2.记录标量数据(Scalar):记录每个batch(批次)的损失和准确率,以及每个epoch(轮次)的训练指标
3.可视化模型结构:可以在TensorBoard 界面 GRAPHS 选项卡中查看模型层次结构(卷积层、全连接层等)。
4.可视化图像:展示原始数据、数据增强效果以及错误预测样本。
5.记录权重和梯度直方图:在 HISTOGRAMS 选项卡中查看不同层的参数分布随训练的变化。监控模型参数(如权重 weights)和梯度(grads)的分布变化,诊断训练问题(如梯度消失 / 爆炸)。
6.启动tensorboard
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
import os
import time
# 设置随机种子以确保结果可复现
torch.manual_seed(42)
# 1. 数据预处理和增强
# 训练集数据增强

最低0.47元/天 解锁文章
92

被折叠的 条评论
为什么被折叠?



