二、DenseBox(KITTI,MALF,CAR,FACE)
Introduction
RCNN 超越 FCN 成为新的state of the art 模型,但是对小目标检测效果不好,两个阶段不能联合优化,训练端到端模型困难。
本文工作:
- 证明了单纯的FCN网络只要设计合理可以用来检测不同尺度和严重遮挡下的目标
- 提出新的FCN模型,DENSEBOX,不需要区域提议,可被用于训练端到段网络。
- 结合了landmark localization的多任务学习使得densebox近一步提高了精度
DenseBox for Detection
基于VGG19 ,
[外链图片转存失败(img-KKcE8URC-1567866049336)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1561018424295.png)]
input(m * n * 3) -> conv ->bilinear upsample -> threshold and NMS -> output(m/4 * n/4 * 5 )
每个像素点都被转换为置信度和到目标边界框的四个距离,然后进行NMS
在图像预处理阶段,在保证人脸和足够的背景信息下对图片进行了剪切
Multi-Task Training
初始化时,保留了VGG19的前12层权重,剩余的四层新的卷积层使用 XAVIER 方法
分类和回归均使用L2 Loss,
Conclusion
- 通过关键点和多任务学习,Dense Box 获得了优越的检测性能。
- 实现了end-to-end的学习
- 不足之处是速度不够,在DenseBox2中有改进?