Single-Shot Refinement Neural Network for Object Detection
摘要
- 单级方法高效,两级方法准确。取两者之长处,克服其缺点,提出单级方法——Refine-Net。精准度高于两级方法。
- 两个内联模块组成
- anchor校准模块——过滤掉无效的anchor,缩小分类器的搜索空间。
- 物体检测模块——粗略地调整anchor的位置和大小,为后续的回归提供更好的初始化。
- 物体检测模块以上一个模块改善后的anchor作为输入,进一步提高回归和预测的效果。
- 设计了,传输连接块(transfer connection block),把特征从第一个模块传递到第二个模块。
- 多任务loss,实现end2end
1 引言
-
两级方法框少,单级方法框多(anchor 多)。
-
单级方法精确度不好是因为,类别不平衡。什么叫做类别不平衡?
-
RON在卷积特征图中使用对象先验约束,大幅度减小了物体搜索空间。
-
Focal loss for dense object detection中使用——重新构造标准交叉熵来集中训练hard examples的一个稀疏集,并且将分配给分类良好的事例的损失降低到最小——的方法来解决这问题。
-
Single Shot Scale-invariant Face Detector中提出max-out标签机制来解决这个问题。
-
两级方法有三个优点
- 使用两级结构简单的处理了类别不平衡的问题。
- 使用了两步级联对目标边界框参数进行回归。
- 使用两阶段特征去描述目标。
(Emmmmmm,这怎么就是优点了。)
2 相关工作
pass
3 网络结构
- 转移连接块(Transfer Connection Block)。
- 连接两个ARM和ODM
- 整合大尺度上下文信息,通过把高级特征加入被传送的特征中。反卷积高级特征来扩大feature map的大小,使用元素级的求和。
- 相加之后,在经过一个卷积层以保证特征可的可识别度。
- 两部级联回归
- 单级检测方法使用基于不同尺度特征层的单步回归来预测对象的位置和大小,对小物体不准确。
- ARM先调整anchor的大小和位置,为ODM提供更好的anchor初始化位置。
- 过滤错误anchor,先把容易分类的错误anchor过滤掉。