1 R-CNN:
结合了region proposal和卷积网络,使region proposal方法流行起来;
2 HCP-2014
HCP(hypothesis-CNN-Pooling).采用BING生成proposal。
3 SSPnet
提升了R-CNN。引入了空间金字塔池化层。
4 Fast R-CNN
扩展了SSPnet,端到端训练,最小化一个损失(confidence 和bounding box 回归)。RPN产生region proposals。
后面提出了mask R-CNN。
5 OverFeat
Sliding window 方法。在知道潜在物体分类的confidence后,从topmost feature map的每一个位置直接预测bounding box。
6 YOLO-2016
Sliding window 方法。使用整个topmost feature map 来预测分类confidence和bounding box。
后面提出了YOLOv2 、YOLOv3
7 SSD-2016
Sliding window 方法。没有使用proposal步骤,而是使用默认(default)box。
8 Cascade R-CNN
包括一系列递增IoU阈值的检测者(detector)。0.5阈值的region-wise检测者(detector)对低IoU输入有较好的检测能力;0.7阈值的region-wise检测者(detector)对高IoU输入有较好的检测能力。
9 EfficientDet
1, 多尺度特征融合;2.模型的规模精简
10 U-Net
主要是U形的设计,左边一些收缩的层和右边一些上采样(扩张的)的层,右边的层用一些上采样操作替换一般神经网络的的池化(pooling)操作。这些上采样层增加了输出的分辨率。为了更好的定位,来自左边收缩层的高分辨率的特征与上采样的输出结合
11 RLSD:
Regional Latent Semantic Dependencies。
RLSD可以看做是CNN+RPN(region proposal network)+LSTM. 用于多标签图片分类,即识别一张图片中的多个物体与类别。CNN采用的VGGNET。

本文介绍了多种目标检测算法,包括1R-CNN、HCP-2014、SSPnet、Fast R-CNN等,并详细阐述了每种算法的特点及改进之处。还涉及了OverFeat、YOLO系列、SSD等滑动窗口方法,以及Cascade R-CNN、EfficientDet等最新进展。
361

被折叠的 条评论
为什么被折叠?



