单对象图像分类技术解析
1. 单对象图像分类概述
在图像领域,许多有趣的图像是在简单背景上包含单个对象。像商品目录图片就是这样构成的,也有一些图像自然呈现这种状态。这类图像在图像搜索中很重要,因为搜索者通常会提出简单的查询,如“大象”,而非复杂描述的查询,所以他们可能不介意简单的搜索结果。此外,从这类图像中学习对象类别的模型可能比从一般图像中更容易。因此,学会对这类图像进行分类是计算机视觉的核心挑战之一。
目前,针对这个问题尝试了各种各样的特征和分类器。图像分类过程与图像搜索自然相关,所以通常使用图像搜索指标来评估分类器。不过,大规模的图像分类实验工作存在困难,需要收集和标注图像,并在大型数据集上训练和评估方法,当前所有实验范式都存在不可避免的缺陷。但在过去十年中,图像分类的理解有了显著改进。当前的工作主要有两个方向:一是尝试提高使用固定类别集的方法的准确性,以深入了解特征构建;二是尝试处理大量类别,以了解一般的判别因素。
2. 图像分类策略
2.1 通用策略
图像分类的通用策略是计算特征,然后将特征向量输入到多类分类器中。根据所使用的特征和分类器的不同,可以产生各种各样的方法。通常,方法会使用HOG和SIFT特征的变体,并结合颜色特征。还会常用视觉词字典,不过构建这些字典的具体方式有很大差异。空间金字塔和金字塔匹配核在表示图像方面表现出色。有多种分类器可应用于生成的特征,不同合理的分类器选择会产生略有不同的结果,但没有一种分类器具有绝对优势。
2.2 具体操作步骤
当面对一个新的图像分类问题时,可按以下步骤操作:
1. 计算图像网格上特征位置的视觉词。如果数据充足,将这些视觉词进行向量量化,类型数
超级会员免费看
订阅专栏 解锁全文
3530

被折叠的 条评论
为什么被折叠?



