信息论旋转鲁棒二进制描述符学习
在计算机视觉领域,图像描述符的性能和效率至关重要。本文将介绍一种新颖的二进制图像描述符,它基于特征选择构建,能在实时应用中发挥出色作用。
1 二进制描述符构建方案
1.1 基本概念
- 图像块与测试 :用 ( w \in R^{s×s} ) 表示图像块,测试 ( t ) 是一个将图像块映射到二进制值 ( t(w) ) 的函数,即 ( t : R^{s×s} \to {0, 1} )。
- 数据库 :数据库 ( D = {w_1, \cdots, w_d} ) 是从共同(未知)分布中抽取的图像块集合。
- 随机变量 :用大写 ( W ) 表示遵循底层图像块分布的随机变量,( X_t = t(W) ) 是由测试 ( t ) 诱导的伯努利随机变量。
1.2 全局框架
主要目的是判断两个图像块 ( w_1 ) 和 ( w_2 ) 在允许的变换下是否相似。具体操作如下:
1. 计算 ( w_1 ) 和 ( w_2 ) 的距离 ( d ),并基于硬阈值进行匹配。
2. 实际中,为两个图像块计算二进制描述符 ( x_1 ) 和 ( x_2 ),并计算它们之间的距离。
3. 学习一个好的度量归结为选择好的特征,通常在离线过程中完成。离线阶段的主要目标是选择固定数量 ( N ) 的测试,这些测试能带来尽可能多的信息。
4. 采用贪心方法,通过迭代选择测试,最大化与新测试信息数量相关的度量。具体流程如下:
超级会员免费看
订阅专栏 解锁全文
1709

被折叠的 条评论
为什么被折叠?



