Reference
我的理解
图片搜索:利用BOW进行图片搜索的一般思路是,对database中的每张图片的关键点所在区域计算SIFT,然后对SIFT进行k-means聚类,若k较小,量化误差会较大,相关性较弱的descriptor会落在同一个cell;若k较大,则出现descriptor noise,相关性较强的descriptor落入不同cell。聚类和得到一个有visual word组成的codebook,对每张图片的每个SIFT进行最近邻统计从而得到每张图片关于codebook中visual word 出现频率的统计直方图。图片搜索的最终要求是判断两张图片的距离,这样直接通过比较两个图片之间SIFT集合之间的距离就可以了,可以简化为计算计算直方图之间的距离嘛。(说得真是不清不楚,我都看不下去了~表达能力太差。)
<