One Stage的目标检测是针对于Two Stage来说的。
说的简单一点,One Stage方法讲究一步到位,通过主干网络+回归网络直接生成目标位置和类别,所以叫做One Stage方法。Two Stage方法则相对于One Stage方法多了一个RPN网络,用来预测检测框,然后在对这些检测框进行判断。
One Stage方法使用CNN来进行特征提取,直接回归物体的类别概率和位置坐标值,相比于Two Stage准确度低一些 识别速度高一些。YOLO与SSD都是属于One Stage方法的经典算法。
One Stage流程:
CNN->区域分类 位置精修
主干网络为CNN,其设计原则如下。
- 尽量选择更加轻量级的CNN网络,能够在一定程度上减少过拟合的产生。
- 多尺度的特征融合网络,可以在一定程度上解决检测目标大小不固定的问题。
可以使用VGG16作为主干网络的选择,这里就不多做赘述。
回归网络
- 区域回归,包括置信度 、位置、类别。
- Anchor机制,某点上进行不同比例的预测框的检测。
如上图所示,我们以YOLO举例说一下如何进行区域回归