LSDA算法(基于大量类别的场景)
LSDA算法背景
资源
论文全称:LSDA: Large Scale Detection through Adaptation
论文链接:https://arxiv.org/abs/1407.5035
论文日期:2014.11.01
算法简介
目前基于大尺寸目标检测的难点:检测数据集标签难以获取。
本文算法就是针对含有检测标签的类别,学习分类与检测两者这件的差别,然后将这些差别迁移到没有检测标签的类别上,训练出检测器。
本文提出的LSDA算法是基于含有大量类别的场景进行目标检测的算法,目前有很多金典算法在目标检测领域表现优秀,检测准确度有了很大的提升,但是这些算法的检测场景中只包含20个左右类别的对象,而现实场景中,对象种类成千上万,这些金典算法基于大尺寸场景的检测表现的不够突出,因此本文提出了一个基于迁移学习原理的自适应检测算法。
由于分类数据集通过搜索引擎可以得到大量的数据,这些数据的标签是图像级别的,只需要识别是何种对象,而检测数据集的标签还需要精确的定位边界框,检测数据集难以获取。目前有很多分类数据集含有上千类目标,可以训练出很好的分类网络,但是检测数据集只有上十类的对象,检测这上十类目标准确率很高,但是应用于其他类别的对象则表现不佳。因此,本文提出了一个迁移学习算法,首先利用分类数据集初始化神经网络,然后再利用检测数据集进行微调,然后将检测数据集训练的参数迁移到没有检测标签的类别上。
算法详情
算法的核心就是针对含有检测标签的类别,学习分类与检测之间的配对关系,然后迁移到不含检测标签的类别上,训练出针对所有类别的检测器。