这几个月多次跑程序后发现,为了达到收敛效果,跑的轮次很多时,超级容易受到外界的干扰导致训练的中断,在开始的几次我总会放弃那些中断的训练而从头再来,但是次数多了,看着那些接近完成的训练会觉得可惜,一个想法冒出来:有什么样的方法可以在yolov10训练中断后能继续中断的轮次跑下去吗?
我在网络上查找了很多方法,yolov8的,yolov9的,yolov7的,yolov5的,不管适不适合yolov10,我都一次次按照那个教程改动相应地方的参数,增加相应的代码,例如:
打开default.yaml改resume=False为resume=True,改完,点了运行还是从第一轮开始。
OK,看到下一篇,要改ultralytics/engine/trainer.py中的check_resume定义里resume=断点pt文件的地址,以及在resume_training中添加ckpt=断点pt文件的地址,然后在训练文件train.py中添加resume=True这个参数,依旧训练train.py这个python文件,但是我得到了一大堆报错,报错的信息诸如:错误的调用了栈,尝试使用字符串作为索引去访问某个对象,但字符串索引必须是整数等等。
以上都是我尝试但是没能成功的方法,但说不定只是这些方法并不适合我的代码文件,或许会适合你的项目,所以在此处也花了笔墨进行说明。
在把上面改动的地方又改回原本样子之后,我尝试编写一个新的训练文件train1.py,里面的代码如下:
from ultralytics import YOLOV10
model = yolov10('your breakproint address')
results = model.train(resume=True)
然后运行这个py文件,就可以成功从断点处运行了,原本的是运行完68断掉的,运行之后直接从69轮开始,符合我的要求预期,运行结果如下图:
如果有帮到你,点赞收藏一下吧!