1.细粒度图像分析任务(又叫子类别图像分类)
分类:强监督(物体标准框、局部标注点)、弱监督(无人工标注信息或者只包含物体标注框);
图 1 细粒度图像识别与粗类识别的区别
数据集描述:Caltech-UCSD Birds-200-2011
图 2 数据集的描述展示
2.细粒度图像分割的相关任务
2.1 两级注意力模型
图 3 细粒度识别的框架
两级注意力模型(关注的是两个不同层次级的特征,其中物体级(强监督模型中的物体标注框)和局部级(强监督模型中局部标注点)的特征)
Selective Search产生大量的局部区域,对于对象级的分类有很多成熟的模型(比如alenet和VGGnet),对于局部级的分类首先对其进行谱聚类,然后进行特征提取,最后将这两类特征进行级联,得到较高的分类精度(77.9%)。
2.2 星座模型
图 4 星座模型的图示
此时使用卷积特征产生的关键点作为局部区域,因为此时通过实验对卷积特征的可视化发现,卷积特征享有比较高的区域往往是原图中潜在的局部区域,因此将卷积特征可以作为一种检测分数(这个分数的大小可以用于判断是否可以将该卷积特征作为局部的标注点区域);而对于前景图像,还是使用Selective Search方法进行提取,最后使用将这两类特征通过VGGnet进行级联进行分类。弱监督模型的工作主要在于检测到局部区域和前景图像;
2.3 第一个强监督模型