单对象图像分类技术全解析
1. 单对象图像分类概述
单对象图像是指在简单背景上基本只包含一个对象的图像,像商品目录图片就属于这类。这类图像在图像搜索中很重要,因为搜索者通常会使用简单的查询词,如“大象”,并且可能不介意简单的搜索结果。此外,从这类图像中学习对象类别的模型可能比从一般图像中更容易。计算机视觉的一个核心挑战就是学会对这类图像进行分类。
目前处理这个问题尝试了各种各样的特征和分类器,当前的工作主要有两条主线:一是尝试使用固定的类别集提高方法的准确性,从而深入了解特征构建;二是尝试处理大量的类别,以了解什么特征具有总体的区分性。
2. 图像分类策略
图像分类的一般策略是先计算特征,然后将特征向量输入到多类分类器中。具体来说:
- 常用特征 :通常使用HOG和SIFT特征的变体,并结合颜色特征。还会常用视觉词字典,不过构建这些字典的具体方式差异很大。空间金字塔和金字塔匹配核在表示图像方面表现出色。
- 分类器选择 :有多种分类器可供选择,不同的合理选择会产生略有不同的结果,但没有一种分类器具有绝对优势。
由于有众多各具优势的方法,很难明确最佳实践。当遇到新的图像分类问题时,可按以下步骤操作:
1. 为图像网格上的特征位置计算视觉词,若数据充足,将这些视觉词进行向量量化,类型数量可设为(10^4)或(10^5)。
2. 用视觉词的直方图表示图像,并使用直方图相交核进行分类。
3. 如果对结果不满意,先改变视觉词的类型数量,再应用空间金字塔核。
4. 最后,可以搜索不同的特征计算包和不同类型的分类器。
超级会员免费看
订阅专栏 解锁全文
6万+

被折叠的 条评论
为什么被折叠?



