YOLO系列
YOLO-v3
终于到V3了,最大的改进就是网络结构,使其更适合小目标检测
➢特征做的更细致,融入多持续特征图信息来预测不同规格物体
➢先验框更丰富了,3种scale,每种3个规格,一共9种
➢softmax改进,预测多标签任务
多scale
➢为了能检测到不同大小的物体,设计了3个scale
scale变换经典方法
➢左图:图像金字塔;右图:单一的输入;
scale变换经典方法
➢左图:对不同的特征图分别利用;右图:不同的特征图融合后进行预测;
残差连接-为了更好的特征
➢从今天的角度来看,基本所有网络架构都用上了残差连接的方法
核心网络架构
➢没有池化和全连接层,全部卷积
➢下采样通过stride为2实现
➢3种scale,更多先验框
➢基本上当下经典做法全融入了
核心网络架构
先验框设计
➢YOLO-V2中选了5个,这回更多了,一共有9种
➢13*13特征图上:(116x90),(156x198),(373x326)
26*26特征图上:(30x61),(62x45),(59x119)
52*52特征图上:(10x13),(16x30),(33x23)
先验框设计
YOLO-V2中选了5个,这回更多了,一共有9种
YOLO系列
·softmax层替代
➢物体检测任务中可能一个物体有多个标签
➢logistic激活函数来完成,这样就能预测每一个类别是/不是