·YOLO-V3
终于到V3了,最大的改进就是网络结构,使其更适合小目标检测
特征做的更细致,融入多持续特征图信息来预测不同规格物体
先验框更丰富了,3种scale,每种3个规格,一共9种
softmax改进,预测多标签任务
·多scale
为了能检测到不同大小的物体,设计了3个scale
·scale变换经典方法
左图:对不同的特征图分别利用;右图:不同的特征图融合后进行预测;
残差连接-为了更好的特征
从今天的角度来看,基本所有网络架构都用上了残差连接的方法(输出x与输入x相加进行计算)
V3中也用了resnet的思想,堆叠更多的层来进行特征提取
核心网络架构
没有池化和全连接层,全部卷积
下采样通过stride为2实现
3种scale,更多先验框
基本上当下经典做法全融入了
图片尺寸变小下采样(卷积层,池化层),变大上采样(YOLO V3)
核心网络架构
先验框设计
YOLO-V2中选了5个,这回更多了,一共有9种
13*13特征图上:(116x90),(156x198),(373x326)
26*26特征图上:(30x61),(62x45),(59x119)
52*52特征图上:(10x13),(16x30),(33x23)
感受野大,检测大目标,感受野中,检测中目标,感受野小,检测小目标
YOLO-V2中选了5个,这回更多了,一共有9种
·softmax层替代
物体检测任务中可能一个物体有多个标签logistic激活函数来完成,这样就能预测每一个类别是/不是