文章目录
前言
在 PaddlePaddle 框架中,断点重训(恢复训练)和 模型部署 需要保存不同类型的文件
一、断点重训(Checkpoint)文件
断点重训需要保存训练过程中的完整状态,包括 模型参数、优化器状态、学习率调度器状态 以及 训练进度信息(如当前 epoch、迭代步数等)。
PaddlePaddle 动态图(推荐)和静态图模式下保存的文件略有不同,但核心文件后缀如下:
1. 动态图(DyGraph)模式
.pdparams 文件
保存模型的 可学习参数(如权重、偏置),通过 model.state_dict() 生成。
paddle.save(model.state_dict(), "model.pdparams") # 仅保存模型参数
.pdopt 文件
保存 优化器的状态(如动量、梯度历史等),通过 optimizer.state_dict() 生成。
paddle.save(optimizer.state_dict(), "optimizer.pdopt") # 保存优化器状态
.pdscaler 文件
如果使用了混合精度训练(paddle.amp.GradScaler),保存梯度缩放器的状态。
paddle.save(scaler.state_dict(),