最近在看这篇Binary descriptor的论文,由于从来没有做过descriptor的相关工作,这篇东西看了很久才看懂一点点。在这里写篇博文记录一下。
这篇文章的工作是提出一种新的方法,用二进制的向量(不同于以往SIFT这种浮点向量)对图像特征点进行描述。特征点对应的区域就是标题中的Receptive Fields。
首先作者基于gradient map的方法(参见论文BGM :Learning Image Descriptors with the Boosting-Trick)定义了一个Receptive Fields的响应:
如果公式看不懂,还可以参考k123han123大神的这篇文章。Response公式(1)(3)的意思是计算区域γ中所有像素梯度在某个方向上的强度。如果还是
对这个响应g(x,y)做一个阈值 t 的截断,这个就得到了这个Receptive Fields对应的binary code。

本文介绍了RFD(Receptive Fields Selection for Binary Feature Description)方法,这是一种使用二进制向量描述图像特征点的创新技术。通过在梯度映射上定义响应,并设置阈值来获取接受域的二进制码。文章探讨了阈值学习、接受域选择的策略,并提供了算法实现。作者提出三个准则用于选择最佳接受域,最终生成用于区分不同类别patch的二进制描述符。
最低0.47元/天 解锁文章

2065

被折叠的 条评论
为什么被折叠?



