问题背景
我在试图复现mmaction2的VideoSwin-T模型时,发现训练loss不收敛。mmaction2官方的训练log显示,loss在第一个epoch就有收敛迹象。但是我在昇腾和V100上训练,loss都没下降的迹象。
考虑过以下几个原因,但都没有解决问题:
- 可能参数配置不对。我的参数配置与官方的配置尽可能统一了,除了我设置
auto_scale_lr=True
。 - 看了下数据集的几个标注样例,没看出
我在试图复现mmaction2的VideoSwin-T模型时,发现训练loss不收敛。mmaction2官方的训练log显示,loss在第一个epoch就有收敛迹象。但是我在昇腾和V100上训练,loss都没下降的迹象。
考虑过以下几个原因,但都没有解决问题:
auto_scale_lr=True
。