主要有两大流派:
候选框(先获取主体所在候选区域,后分类,又称two-stage技术):RCNN系列、SPP、R-FCN
回归法(直接进行BBox回归与主体分类):YOLO、SSD
一、定义
ROI(region of interest):感兴趣区域
region proposal method:候选区域方法
RPN(region proposal network):候选区域网络
滑动窗口检测
SS(selective search):选择性搜索
fpn(feature pyramid networks):特征金字塔网络
二、RCNN(SS替代滑动滑窗)
用候选区域方法替代滑动窗口,更快更准。CNN classifier用于获取4096个特征,SVM用于确定box的类别,regressor边界框回归器/线性回归器/全连接层用于提炼边界框。
例如下图就是利用像素增长(基于像素纹理)获得的区域,与其对应的感兴趣区域(ROI),将这些ROI昨晚候选区域,进行选择性搜索。总的来说RCNN就是利用了传统算法获取候选区域,再利用CNN提取特征,进行分类回归。是一种传统+深度的方法。
三、fast RCNN(CNN放在SS前)
ROI有重叠的可能,将ROI放到CNN classifier中时,就有重复计算的问题,由此将CNN这一步放到前面,先获取CNN,再计算ROI(例如利用VGG的conv5来计算ROI),再裁减特征图。
img——CNN获取Feature map——计算ROI——裁取——ROI池化——FC算class及回归box
采用的损失有:分类损失、定位损失
四、ROI池化
ROI池化=ROI+最大池化
对Feature map取感兴趣区域,若为2*2目标,将ROI区域划分为相等或相似大小的2*2个区域,每个区域取最大值
五、Faster R-CNN(RPN网络替代SS)
参考链接:https://blog.youkuaiyun.com/liuxiaoheng1992/article/details/81843363
用候选区域网络(RPN)代替候选区域方法(不用SS)生成ROI,简单理解就是用深度网络的方法代替了融合像素的方法。