LLC算法coding与pooling解析

最新推荐文章于 2025-05-19 19:55:37 发布

原创

最新推荐文章于 2025-05-19 19:55:37 发布 · 4.1k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#machine learning

本文介绍了Locality-constrained Linear Coding (LLC) 算法在图像分类中的coding和pooling过程。首先，通过Lazebnik's SIFT算法提取Dense SIFT特征。接着，详细解析了coding步骤，包括寻找样本点的k个近邻，计算局部重建权值矩阵，以及利用拉格朗日乘数法求解最优解。最后，讨论了采用max-pooling的方法来处理编码后的特征。

这几天看了Locality-constrained Linear Coding for Image Classification算法，里面涉及到coding与pooling过程，在此做一解析：

1）Feature Extract

在代码部分，作者用了Lazebnik's SIFT算法提取 Dense Sift特征

CalculateSiftDescriptor(rt_img_dir, rt_data_dir, gridSpacing, patchSize, maxImSize, nrml_threshold)

其中patchSize为提取Sift特征的patch大小，gridSpacing为patch移动的步长

2）coding

coding过程其实是LLE (Locally Linear Embedding) 局部线性嵌入算法(链接)的前两步

（1）寻找每个样本点的k个近邻点

% find k nearest neighbors
%       B       -M x d codebook, M entries in a d-dim space
%       X       -N x d matrix, N data points in a d-dim space
XX = sum(X.*X, 2);
BB = sum(B.*B, 2);
D