迭代量化方法——Iterative Quantization: A Procrustean Approach to Learning Binary Codes

本文链接：https://blog.youkuaiyun.com/lhaof/article/details/50758156

本文介绍了Yunchao Gong在2011年CVPR会议上发表的文章《Iterative Quantization: A Procrustean Approach to Learning Binary Codes》，该文探讨如何学习保持相似性的二进制编码，用于大规模图像集合的快速检索。通过迭代量化法（ITQ），实现了数据的零中心化和最小化量化误差，该方法与谱聚类和正交Procrustes问题相关，并可以应用于PCA或CCA。ITQ解决了其他二进制编码方法如PCA、SH和SSH的局限，通过交替最小化优化正交变换矩阵和二进制编码矩阵，实现局部最优解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

《Iterative Quantization: A Procrustean Approach to Learning Binary Codes》这篇文章发表在2011年的CVPR会议上，由Yunchao Gong作为第一作者所著。本文是对上述文章部分段落的翻译和解析，希望读者能对这篇文章有大致的理解。

这篇文章立足的问题是如何学习一种similarity-preserving的二进制编码，similarity-preserving的意思是相似性保存，能保存相似性。这种二进制编码在大规模图片集合中的快速检索，比如使用哈希表是很有作用的。所谓能保留相似性的意思，就是本来相似的图片，它们编码出来的二进制也是相似的。本来不相似的图片，它们编码出来的二进制也是不相似的。

Yunchao Gong用一种交替最小化法，来找到一种最优的方式来旋转“零中心的”数据，使得量化误差最小。“零中心”为zero-centered，意思是，假设有n个d维数据，第i个数据为Xi，sum（Xi）为d维零向量。将数据零中心化的方法是，所有原始数据点减轻数据均值。量化误差，是在将数据点映射到一个零中心的二进制超立方体后产生的误差。注意该二进制超立方体的每一维端点值是-1和1，而并不是0和1。这个方法叫ITQ（Iterative Quantization method，迭代量化法）与多类别的谱聚类和正交的Procrustes问题有联系，能用在PCA或者CCA（canonical correlation analysis）上面。

很多二进制编码方法的第一步都是用PCA降维。但由于每个PCA方向上，数据的方差都不同，比如说高方差值的方向携带更多信息，那么每个PCA方向都编码成相同比特数肯定效果不好。为了解决这一问题，SH（Spectral Hashing，谱哈希）用一种可分离的拉普拉斯特征函数的规范化来将更多的比特赋予到取值范围比较广的数据上。但是，这个方法是启发式的并且依赖于一个不