Bag of Visual Words (Bag of Features)
采用k -means 聚类方法对所提取的大量特征进行无监督聚类,将具有相似性较强的特征归入到一个聚类类别里,定义每个聚类的中心即为图像的“单词”,聚类类别的数量即为整个视觉词典的大小。这样,每个 图像就可以由一系列具有代表性的视觉单词来表示, 在得到每类图像的视觉单词袋表示之后,便可以应用这些视觉单词来构造视觉词典,然后对待分类图像进行同样方法的特征提取和描述,最后将这些特征对应到视觉词典库中进行匹配,去寻找每个特征所对应的最相似的视觉单词,得到直方图统计表示,然后应用分类器进行分类。这样就将应用于文档处理的BOW模型思想成功地移植到了图像处理领域。
Steps:
-
Feature extraction
特征提取
-
Learn “visual vocabulary”
学习“视觉词汇
-
Quantize features using visual vocabulary
使用视觉词汇量化特征
-
Represent images by frequencies of “visual words”
用“视觉单词”的频率表示图像
Feature extraction 局部特征提取
通过分割、密集或随机采集、关键点或稳定区域、 显著区域等方式使图像形成不同的patches,