YOLO系列
·YOLO - V3
- 终于到V3了,最大的改进就是网络结构,使其更适合小目标检测
- 特征做的更细致,融入多持续特征图信息来预测不同规格物体
- 先验框更丰富了,3种scale,每种3个规格,一共9种
- softmax改进,预测多标签任务
·多scale
- 为了能检测到不同大小的物体,设计了3个scale
·scale变换经典方法
- 左图:图像金字塔;右图:单一的输入;
·scale变换经典方法
- 左图:对不同的特征图分别利用;右图:不同的特征图融合后进行预测;
·残差连接-为了更好的特征
- 从今天的角度来看,基本所有网络架构都用上了残差连接的方法
- V3中也用了resnet的思想,堆叠更多的层来进行特征提取
·核心网络架构
- 没有池化和全连接层,全部卷积
- 下采样通过stride为2实现
- 3种scale,更多先验框
- 基本上当下经典做法全融入了
·先验框设计
- YOLO - V2中选了5个,这回更多了,一共有9种
- 13×13特征图上:(116×90),(156×198),(373×326)
- 26×26特征图上:(30×61),(62×45),(59×119)
- 52×52特征图上:(10×13),(16×30),(33×23)
·先验框设计
- YOLO - V2中选了5个,这回更多了,一共有9种
·softmax层替代
- logistic检测任务中可能一个物体有多个标签
- logistic激活函数来完成,这样就能预测每一个类别是/不是