计算机视觉学习8_BOW模型_Bag of features_图像搜索_视觉单词与图像分类codebook维数设置为-优快云博客

本文链接：https://blog.youkuaiyun.com/zxm_jimin/article/details/90114072

文章目录

BOW模型
Bag of feature：图像检索流程
1. 特征提取、学习 “视觉词典（visual vocabulary）
2. 针对输入特征集，根据视觉词典进行量化
3. 把输入图像，根据TF-IDF转化成视觉单词（ visual words）的频率直方图
5. 构造特征到图像的倒排表，通过倒排表快速索引相关图像
6. 根据索引结果进行直方图匹配
代码实现
1、生成代码所需要的模型-视觉词汇
2、查询图片

BOW模型

Bag-of-words models
研表究明，汉字序顺并不定一影阅响读。比如当你看完这句话后，才发这现里的字全是都乱的。
在这里插入图片描述

视觉上具相似性的图像。这样返回的图像可以是颜色相似、纹理相似、图像中的物体或场景相似；总之，基本上可以是这些图像自身共有的任何信息。
因此，有了Bag of features模型

Bag of feature：图像检索流程

1. 特征提取、学习 “视觉词典（visual vocabulary）

从我们的图片库中。提取每张图片的特征，作为视觉单词。
这通常可以采用 SIFT 局部描述子做到。
关于SIFT的更多内容可以移步我另一个博客 https://blog.youkuaiyun.com/zxm_jimin/article/details/88597258
它的思想是将描述子空间量化成一些典型实例，并将图像中的每个描述子指派到其中的某个实例中。这些典型实例可以通过分析训练图像集确定，并被视为视觉单词。

从一个（很大的训练图像）集提取特征描述子，利用一些聚类算法可以构建出视觉单词。
聚类算法中最常用的是采用 K-means。视觉单词是在给定特征描述子空间中的一组向量集。

基本Kmeans算法介绍及其实现
参考博客：https://blog.youkuaiyun.com/qll125596718/article/details/8243404
在这里插入图片描述
K-means算法下的聚类中心，即特征点——就是我们所说的视觉词典。
（一旦训练集准备足够充分, 训练出来的码本（ codebook）将具有普适性）