21、图像数据库中二进制特征检索研究

脸先着地天使

于 2025-10-08 14:25:06 发布

阅读量15

点赞数

CC 4.0 BY-SA版权

分类专栏：相似性搜索前沿探析文章标签：二进制特征图像数据库哈希检索

本文链接：https://blog.youkuaiyun.com/jwt8token/article/details/153807240

相似性搜索前沿探析专栏收录该内容

37 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

图像数据库中二进制特征检索研究

在图像数据库的检索任务中，二进制特征的处理至关重要。本文将探讨适用于二进制特征的聚类和量化技术，以及对这些技术进行的实验评估。

1. 聚类与量化技术

在处理二进制特征时，可采用 kMedoids、kMedians 或 kMeans 算法。不过，直接使用 kMeans 并非依据 L1 距离进行优化，而是基于平方欧几里得距离，这在理论上不适用于汉明空间。实际应用中，kMedians 算法更为常用，它依据 L1 范数优化聚类中心，与二进制特征向量的汉明距离直接对应。对于二进制特征，kMedians 还可进一步优化，因为在这种情况下，中位数计算可简化为多数投票。

基于词袋视觉（BoVW）的系统中，二进制特征查询的方法最早由 Galvez - Lopez 和 Tardos 提出。为实现可接受的运行时性能，他们采用了层次 kMeans（HkM）的思想。HkM 以相对较小的 k′值进行 kMeans 聚类，将数据库中的每个点分配到相应的聚类中，然后对每个特征向量集递归聚类，直至达到指定高度 l，形成具有 k′l 个叶节点的树状结构。这种树结构使特征向量分配到聚类中心的计算复杂度降至 O(k′L)，但存储复杂度仍为 O(k′L)，且会损失一定的准确性。

Muja 和 Lowe 以及 Trzcinski 等人同时提出在二进制特征向量上使用随机聚类树森林。将其映射到局部敏感哈希（LSH）时，树的叶子节点提供哈希函数，每棵树为不同的哈希表提供哈希函数。这些树与 HkM 树类似，但聚类中心不是通过 kMedians 分配，而是从数据中随机选择。若使用多个哈希表（即多棵树），相应的哈希函数应相互独立。

此外，用于实值图像特征的其他量化