目录
Low-stage feature alignment module
Low-stage information fusion module
High-stage feature alignment module.
High-stage information fusion module.
Gold-yolo解决了一个怎样的问题?
FPN简述
——摘自详解FPN网络-优快云博客
图(a)中,针对每一层的特征进行提取和预测,只要在任意层中检测到了目标即算检测成功,但是这种方法对于内存和时间的消耗都极大,故鲜有使用;
#图(b)中,像SPP net,Fast RCNN,Faster RCNN是采用这种方式,即仅采用网络最后一层的特征。使用感受野最大的一层,与(a)相比,虽然节约了时间,但是难以实现小特征的检测。
——详参RCNN、Fast RCNN、Faster RCNN算法详细介绍_AI追随者的博客-优快云博客
#图(c)像SSD(Single Shot Detector)采用这种多尺度特征融合的方式,没有上采样过程,这种方式不会增加额外的计算量。单但是这种方式的代价便是小目标检测的准确率
图(d)便是FPN网络,在以上几种方法的基础上,FPN通过不同层级的特征融合实现了准确率和速度的最优解。如下图所示,在FPN网络中,首先对于检测图片自上而下形成特征金字塔,然后以类似残差网络的形式进行自下而上的特征融合,例如,左侧从上到下依次编号1,2,3,4,右侧依次编号1',2',3',1'进行2倍上采样,而2通过1*1卷积进行resize,而后两者融合后进行预测。

FPN的缺陷
但是,FPN也同样存在一个缺陷——对于不同层级之间的信息融合,例如 level-1和level-2,其融合可以直接进行,但是,对于跨层级的融合,如level-1和level-3,需要先融合level-2和level-3,然后level-1再通过融合后的结果间接地获取level-3的信息,此方法会造成信息传递过程中的丢失,使信息融合的有效性收到限制。
Gold-yolo做出的改善
G