
训练/推理异常+经验
训练/推理异常+经验
Pengsen Ma
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【训练经验】多模态融合中,哪种方法对下游预测任务最有效?(Concat、Add、Weight add、Attention)
被认为是四种嵌入层融合技术中表现最好的方法。该方法在不同模型和输出模态下,始终优于基线模型。也被证明能够提升模型性能,适用于图形和文本模型。原创 2025-03-14 20:11:47 · 246 阅读 · 0 评论 -
【训练异常】resume训练好的模型,继续训练,发现loss不是从上次的loss继续的loss
其实不是,是因为你没有resume optimization,不过你不resume optimization问题也不大,后面loss降得很快就变成上次的了。训练过程中resume训练好的模型,继续训练,发现loss不是从上次的loss继续的loss,但是一会儿loss就降到和上次loss基本一致的情况了。难道是哪里有问题了?原创 2025-03-10 10:13:32 · 339 阅读 · 0 评论