参考博客:https://blog.youkuaiyun.com/u014380165/article/details/77110702
1. 概述
该论文主要涉及了一种可以从头学习对象检测器的框架------ Deeply Supervised Object Detector (DSOD)。
现有的目标检测都需要现在ImageNet上进行预训练后,再通过分类损失和定位损失进行微调。微调模型的好处是可以在一定程度上缓解这种偏差,但不能从根本上缓解这种偏差。此外,将预先训练的模型从分类转移到差异域之间的检测更加困难。比如医学领域。
对上述问题更好的解决方法是无需预训练从头开始训练模型。但是,由于损失函数的复杂性,先前很多尝试不需要预训练的方法都失败了。而本文中的DSOD,我们提供了一套从头开始训练物体检测器的设计原则。 其中一个关键的发现是,通过密集的分层连接实现的深度监督在学习良好的检测器方面起着关键作用。
论文中总结预训练模型有两个好处:一,目前有很多公开的模型可供使用,目标检测重之需要重新利用就可以;二,微调可以快速生成最终模型,并且需要比分类任务少得多的实例级注释训练数据。
但同样地,使用预训练模型有一定的局限:
一,结构设计的局限性。预训练的模型基本上都来自基于ImageNet训练的分类网络,通常包含大量的参数。现有的目标检测器直接采用预训练的网络,因此几乎没有灵活性来控制/调整网络结构(即使是网络结构的微小变化)。计算资源的需求也受到繁