论文题目:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
论文地址:https://arxiv.org/pdf/1612.08242v1.pdf
相对于YOLO1,YOLO2提出了很多方案改进网络的性能,比如
(1)批正则化数据
(2)用更高的分辨率以适应小图像的检测
(3)用prior boxes作为参考系让学习更容易
(4)用k-mean 聚类算法自己决定每个网格更适合的anchor box个数
(5)限制预测偏移量范围在0-1之间使得模型更稳定
(5)训练过程中改变输入图像的size以适应不同分辨率物体的检测
(6)联合分类和检测数据集使其可以检测出超过9000种类的物体等等
(7)去掉最后一个池化层,得到高分辨率的输出,虽然精度下降,但可以预测更多的框。
同时,它使用的使自己的网络DarkNet-19而不是VGG。
一、论文解读
1、YOLO2解决了大部分目标检测模型只预测很少类别物体的限制,可以检测出超过9000种不同类别的数据。(YOLO1仅20种)
大部分目标检测模型都只能预测很少类别的物体,主要是标注目标数据集太昂贵了,不可能达到图像分类数据集的规模。YOLO2提出一种联合训练算法,可以利用有大量数据的分类数据集ImageNet扩大目标检测系统检测的数据范围,利用有标签的目标检测数据集COCO去学习精确地定位物体的位置,同时使用大型分类数据集ImageNet来增加它的泛化能力。
2、YOLO2提出了很多改进算法改善目标检测模型的表现ÿ