图像数据库中二进制特征检索研究
在图像数据库的检索任务中,二进制特征的处理至关重要。本文将探讨适用于二进制特征的聚类和量化技术,以及对这些技术进行的实验评估。
1. 聚类与量化技术
在处理二进制特征时,可采用 kMedoids、kMedians 或 kMeans 算法。不过,直接使用 kMeans 并非依据 L1 距离进行优化,而是基于平方欧几里得距离,这在理论上不适用于汉明空间。实际应用中,kMedians 算法更为常用,它依据 L1 范数优化聚类中心,与二进制特征向量的汉明距离直接对应。对于二进制特征,kMedians 还可进一步优化,因为在这种情况下,中位数计算可简化为多数投票。
基于词袋视觉(BoVW)的系统中,二进制特征查询的方法最早由 Galvez - Lopez 和 Tardos 提出。为实现可接受的运行时性能,他们采用了层次 kMeans(HkM)的思想。HkM 以相对较小的 k′值进行 kMeans 聚类,将数据库中的每个点分配到相应的聚类中,然后对每个特征向量集递归聚类,直至达到指定高度 l,形成具有 k′l 个叶节点的树状结构。这种树结构使特征向量分配到聚类中心的计算复杂度降至 O(k′L),但存储复杂度仍为 O(k′L),且会损失一定的准确性。
Muja 和 Lowe 以及 Trzcinski 等人同时提出在二进制特征向量上使用随机聚类树森林。将其映射到局部敏感哈希(LSH)时,树的叶子节点提供哈希函数,每棵树为不同的哈希表提供哈希函数。这些树与 HkM 树类似,但聚类中心不是通过 kMedians 分配,而是从数据中随机选择。若使用多个哈希表(即多棵树),相应的哈希函数应相互独立。
此外,用于实值图像特征的其他量化
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



