

这是我训练一个垃圾分类的yolo-tiny网络的输出可视化结果,怀疑可能有如下几条原因导致了如此波动:
1、数据集问题。大部分图片都是从网络上爬取的,少部分是自己拍摄的,质量层次不齐且无法充分表现出此类垃圾特征。因为已经检查过直接用来训练的txt文件,所以可以基本排除是格式转化出现的问题。
2、learning rate选择不合适。
batch=64
subdivisions=8
width=416
height=416
channels=3
momentum=0.9
decay=0.0005
angle=45
saturation = 3
exposure = 3
hue=.2
learning_rate=0.01
burn_in=1000
max_batches = 2500
policy=steps
steps=100,500,1000
scales=.1,.1,.1
这是我训练的参数,可能我的learning rate太大了,下次训练时准备调整learning_rate和steps以及steps。
或许可以尝试一下调整batch、subdivisions,增大batch或者减小sub(每batch/sub个样本更新一次参数。)
欢迎大家给小白提建议,以改善训练效果。

一位AI算法标注工程师分享了使用Yolo-tiny网络进行垃圾分类任务的训练过程,发现训练结果波动较大,疑似由数据集质量和learningrate设置不当引起。文章探讨了可能的解决方案,包括调整学习率、batch大小和subdivisions参数。
5210

被折叠的 条评论
为什么被折叠?



