from:
http://blog.163.com/pz124578@126/blog/static/2352269420128735912834/
文章spatial pyramid matching for recognizing natural scene categories用于图像分类;是在BOW的基础上提出来的一种提升方法;特征和词典构造方法与BOW一致;
方法如下:

这里就只阐述SPM的方法;
上面的黑圆点、方块、十字星代表一副图像上某个pitch属于kmeans后词典中的某个词;
1、将图像划分为固定大小的块,如从上到下:4*4,2*2,1*1, 然后统计每个方块中词中的bow;
2、从最底层金字塔开始(这儿是4*4),统计么个块内的直方图;
3、然后做fine—coarse的归并,得到上一层的直方图统计情况(如上图从左至右);
4、最后个将每个金字塔的中获得的直方图都串联起来,并且给每层金字塔附上相应的权重,最底层权重最大,依次减少的过程;
5、将spm放入svm中进行训练和预测;
如下图所示:横轴为待分类的类别数目,纵轴为分类精度;
红色线为SPM测试结果; 蓝色线为BOW测试结果;
总体而言,在BOW基础上进行SPM所花的时间是值得的。
另外在caltech101中结果如下(SPM):
每类中含有25个训练样本,15个测试样本。

使用dsift:
5类:98%,10类:80%,15类:74%,20类:65%,30类:59.3%。
使用hog:
5类:96%,10类:74%,15类:62%,80类:32%。
使用lbp:比较差点。
使用phow:5类:90%,10类:81%,15类:67%,20类:66%,30类:57%,40类:57%,50类:55%,70类:54%,80类:54.7.
使用LLC在caltech101结果如下:每类中包含25个训练样本,15个测试样本。
使用phow:10类:95%,20类:80%,50类:75%,80类:72.5%。
基本与原文作者得到的实验结果相差不多。使用LLC确实能够提升分类的准确率。