计算机视觉与无监督学习:图像分割与机器人控制的融合探索
1. 计算机视觉中的近邻搜索方法
在计算机视觉领域,高效的近邻搜索对于图像检索和目标识别至关重要。目前有多种方法被用于实现这一目标,但每种方法都有其优缺点。
- 随机化Kd树(Randomized Kd - trees) :在目标识别中取得了一定的成功。然而,对于高维高度稀疏的数据,其不平衡的性质会导致强制创建空的或近乎空的叶子节点和节点,从而显著降低性能。
- 随机决策树(Randomized decision trees) :能够提供对数时间编码。但在计算分裂标准时,它仅使用一个或几个属性,并且树的每条路径通常只访问少数特征维度。
- 词汇树(Vocabulary tree) :与决策树不同,词汇树使用所有属性,但对于非常大的数据库,其检索速度较慢。
- 可扩展词汇树(Scalable Vocabulary Tree,SVT) :通过重复的分层K - means聚类构建,可提高检索准确性和效率。但由于高维空间的“维度灾难”问题,在高维描述符空间中难以加速。
为了部分解决这些问题,提出了k - 路随机量化树(k - way random quantization tree,QT)方法。该方法基于词汇树的概念,但有重要的变化。其构建过程如下:
1. 第一层 :只有一个节点,即树的根节点。
2. 第二层 :从整个数据库中随机选择一组k个代表性模式作为聚类中心。然后
超级会员免费看
订阅专栏 解锁全文
17万+

被折叠的 条评论
为什么被折叠?



