【Image captioning】Meshed-memory transformer在自定义数据集的训练与调试

CV视界

已于 2023-09-08 10:31:58 修改

阅读量832

点赞数 1

分类专栏： Image captioning学习文章标签： transformer 深度学习人工智能

于 2023-09-04 22:58:31 首次发布

本文链接：https://blog.youkuaiyun.com/lihuanyu520/article/details/132679479

版权

Image captioning学习专栏收录该内容

70 篇文章 ¥99.90 ¥299.90

订阅专栏

本文介绍了如何在自定义数据集上训练和调试Meshed-memory transformer模型。作者在训练过程中遇到了与数据集适应性和PyTorch版本相关的问题，通过调整代码和更新库解决了这些问题，并成功完成模型训练和测试。推荐的相关专栏涵盖了Image captioning、CNN模型压缩、模式识别与人工智能以及PyTorch的自然语言处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Meshed-memory transformer在自定义数据集的训练与调试

作者：安静到无声个人主页

模型训练

train函数主要包含如下参数：

Argument	Possible values
–exp_name	实验名字
–batch_size	Batch size (default: 10)
–workers	Number of workers (default: 0)
–m	内存向量的数量（默认值为40）
–head	Number of heads (default: 8)
–warmup	学习率调度预热值（默认值为10000）
–resume_last	如果使用，训练将从最后一个检查点恢复。</