本笔记主要以pytorch lightning中的ModelCheckpoint接口解析pytorch lightning中模型的保存方式
文章目录
ModelCheckpoint
该类通过监控设置的metric定期保存模型,LightningModule 中使用 log() 或 log_dict() 记录的每个metric都是监控对象的候选者;更多的信息可以进入此链接浏览。训练完成后,在日志中使用 best_model_path 检索最佳checkpoint的路径,使用 best_model_score 检索其分数
pytorch_lightning.callbacks.ModelCheckpoint(dirpath=None, filename=None, monitor=None, verbose=False, save_last=None, save_top_k=1, save_weights_only=False, mode=‘min’, auto_insert_metric_name=True, every_n_train_steps=None, train_time_interval=None, every_n_epochs=None, save_on_train_epoch_end=None)
- dirpath(Union[str, Path, None])–保存模型文件的路径;默认情况下,dirpath 为 None 并将在运行时设置为 Trainer 的 default_root_dir 或 weights_save_path 参数指定的位置,如果 Trainer 使用logger,则路径还将包含logger名称和版本
# custom path,自定义路径
# saves a file like: my/path/epoch=0-step=10.ckpt,文件名会自动由epoch和step构成
checkpoint_callback = ModelCheckpoint(dirpath='my/path/')
- filename(Optinal[str])–checkpoint文件名;可以包含要自动填充的命名格式选项;默认情况下,文件名是 None 并将设置为 ‘{epoch}-{step}’
# save any arbitrary metrics like `val_loss`, etc. in name,将感兴趣的metrics保存在文件名中
# saves a file like: my/path/epoch=2-val_loss=0.02-other_metric=0.03.ckpt
checkpoint_callback = ModelCheckpoint(
... dirpath='my/path',
..

本文深入解析了PyTorch Lightning中的ModelCheckpoint接口,指导如何利用它进行模型周期性保存,自定义文件名格式,并演示了如何在训练后检索最佳模型。讲解了关键参数如monitor、filename和save_top_k的使用方法。
最低0.47元/天 解锁文章
2438





