保存加载用于推理的常规Checkpoint/或继续训练

PyTorch模型保存与加载:检查点与状态字典
该博客介绍了如何在PyTorch中保存和加载模型的检查点,包括模型参数、优化器状态以及训练的epoch和loss。通过使用`torch.save()`和`torch.load()`,可以在训练过程中定期保存模型,并在之后的推理或继续训练时加载这些信息。检查点文件包含了模型的重要状态,而state_dict则用于存储模型参数。
部署运行你感兴趣的模型镜像

保存加载用于推理的常规Checkpoint/或继续训练

https://blog.youkuaiyun.com/qq_38765642/article/details/109784913

if (epoch+1) % checkpoint_interval == 0:

        checkpoint = {"model_state_dict": net.state_dict(),
                      "optimizer_state_dict": optimizer.state_dict(),
                      "epoch": epoch}
        path_checkpoint = "./checkpoint_{}_epoch.pkl".format(epoch)
        torch.save(checkpoint, path_checkpoint)
#或者
#保存
torch.save({
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'loss': loss,
            ...
            }, PATH)
#加载
model = TheModelClass(*args, **kwargs)
optimizer = TheOptimizerClass(*args, **kwargs)

checkpoint = torch.load(PATH)
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']

model.eval()
# - 或者 -
model.train()

checkpoint检查点:不仅保存模型的参数,优化器参数,还有loss,epoch等(相当于一个保存模型的文件夹)
state_dict可以用于保存模型的参数 及优化。

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

### YOLOv8 训练过程中数据保存的方法 在使用 YOLOv8 进行训练时,可以通过配置参数来指定模型权重和其他训练结果的保存方式。以下是关于如何保存 YOLOv8 训练数据的具体方法: #### 1. 默认保存路径 当执行 `model.train()` 者通过命令行调用 `yolo train` 时,默认情况下,YOLOv8 将会在当前工作目录下创建一个名为 `runs/train/` 的文件夹用于存储所有的训练结果[^1]。该文件夹结构通常如下所示: ``` runs/ └── train/ ├── exp/ # 实验编号默认从exp开始 │ ├── weights/ # 存储每轮迭代后的最佳权重和最后一步的权重 │ ├── plots/ # 可视化图表(如混淆矩阵、PR曲线等) │ ├── labels/ # 验证集预测标签 │ └── results.csv # 损失函数变化记录及其他指标 ``` #### 2. 自定义保存路径 如果希望更改默认保存位置,则可以在训练脚本中设置 `project` 和 `name` 参数。例如,在 Python 脚本中修改如下代码片段: ```python results = model.train( data="train.yaml", epochs=500, imgsz=640, batch=32, workers=16, project='my_project', # 设置项目名称 name='experiment_1' # 设置实验名称 ) ``` 上述代码将会把训练结果存放到自定义路径下的子文件夹中,比如:`./my_project/experiment_1/`。 对于 CLI 命令形式也可以实现相同功能: ```bash yolo train \ data=wheat.yaml \ model=yolov8s.pt \ epochs=300 \ imgsz=640 \ batch=8 \ workers=0 \ device=cpu \ project=my_custom_folder \ name=my_experiment_name ``` #### 3. 权重文件说明 - **best.pt**: 表示在整个训练期间表现最好的模型权重。 - **last.pt**: 是最后一次完成 epoch 后所保留下来的最终版本模型权重。 两者均位于 `weights/` 文件夹内[^2]^。 #### 4. 中断恢复机制 为了支持长时间运行的任务可能因意外中断而丢失进度的情况,YOLO 提供了一个自动备份的功能——即每隔一定数量步数就会生成一次临时检查点(checkpoint)。“resume”选项允许从中断处继续之前未完成的工作流程而不需重新启动整个过程: ```python if __name__ == '__main__': model = YOLO('path_to_interrupted_checkpoint.pt') result = model.train(resume=True) ``` #### 5. 导出最终模型 除了常规保存外还可以考虑导出简化版推理专用模型以便部署到其他环境当中去应用。这可通过加载对应的最佳权值再单独操作完成: ```python from ultralytics import YOLO # Load the best performing model after training. trained_model = YOLO("runs/train/exp/best.pt") # Export it into ONNX format which is widely supported across platforms. success = trained_model.export(format="onnx") print(f"Export successful? {success}") ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值