乘积量化(Product Quantization/PQ)笔记

本文介绍了乘积量化(PQ)技术,一种高效的数据压缩和近似最近邻搜索方法。通过将高维向量分解成多个低维子向量并分别进行量化,可以显著减少存储需求而不大幅牺牲搜索精度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文链接:https://hal.inria.fr/file/index/docid/825085/filename/jegou_pq_postprint.pdf

Product quantization(PQ),国内直译为乘积量化,这里的乘积是指笛卡尔积,意思是指把原来的向量空间分解为若干个低维向量空间的笛卡尔积,并利用Kmeans算法对分解得到的低维向量空间分别做量化。这样每个向量就能由多个低维空间的量化code组合表示。

换句话描述就是,把原始D维向量分成m组,那么每组就是D/m维的子向量,各自用kmeans算法学习到一个码本,然后这些码本的笛卡尔积就是原始D维向量对应的码本。
用qj表示第j组子向量,用Cj表示其对应学习到的码本,那么原始D维向量对应的码本就是C=C1×C2×…×Cm。
用k∗表示子向量的聚类中心点数或者说码本大小,那么原始D维向量对应的聚类中心点数或者说码本大小就是k=(k∗)m。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值