此部分是计算机视觉部分,主要侧重在底层特征提取,视频分析,跟踪,目标检测和识别方面等方面。对于自己不太熟悉的领域比如摄像机标定和立体视觉,仅仅列出上google上引用次数比较多的文献。有一些刚刚出版的文章,个人非常喜欢,也列出来了。
33. SIFT
关于SIFT,实在不需要介绍太多,一万多次的引用已经说明问题了。SURF和PCA-SIFT也是属于这个系列。后面列出了几篇跟SIFT有关的问题。
[1999 ICCV] Object recognition from local scale-invariant features
[2000 IJCV] Evaluation of Interest Point Detectors
[2006 CVIU] Speeded-Up Robust Features (SURF)
[2004 CVPR] PCA-SIFT A More Distinctive Representation for Local Image Descriptors
[2004 IJCV] Distinctive Image Features from Scale-Invariant Keypoints
[2010 IJCV] Improving Bag-of-Features for Large Scale Image Search
[2011 PAMI] SIFTflow Dense Correspondence across Scenes and its Applications
翻译
从局部尺度不变特征识别物体——http://tongtianta.site/paper/56806
作者:David G. Lowe
摘要 -已经开发了使用新型本地图像特征的对象识别系统。这些特征对于图像缩放,平移和旋转是不变的,而对于照明变化和仿射或3D投影则是部分不变的。这些功能与下颞叶皮质的神经元具有相似的属性,这些属性用于灵长类动物视觉中的物体识别。通过分阶段筛选方法可以有效地检测特征,该方法可以识别比例尺空间中的稳定点。通过在多个方向平面和多个比例上表示模糊的图像梯度,创建允许局部几何变形的图像关键点。这些键用作识别候选对象匹配项的最近邻居索引方法的输入。通过为未知模型参数找到一个低残差最小二乘解,可以完成对每个匹配项的最终验证。实验结果表明,在杂乱的部分遮挡图像中,可以以不到2秒的计算时间实现鲁棒的目标识别。
1 简介
在杂乱的现实场景中进行对象识别需要不受附近杂乱或部分遮挡影响的局部图像特征。这些特征必须至少部分不变于照明,3D投影变换和常见对象变化。另一方面,这些特征还必须具有足够的独特性,以在许多替代方案中标识特定的对象。对象识别问题的困难在很大程度上是由于未能成功找到这种图像特征。但是,最近对密集局部特征的使用的研究(例如,Schmid&Mohr [19])表明,通常可以通过使用在大量可重复位置采样的局部图像描述符来实现有效的识别。
本文提出了一种新的图像特征生成方法,称为尺度不变特征变换(SIFT)。这种方法将图像转换成大量的局部特征向量,每个局部特征向量对于图像的平移,缩放和旋转都是不变的,而对于照明变化和仿射或3D投影则是部分不变的。先前的局部特征生成方法缺乏尺度不变性,并且对投影失真和照明变化更敏感。SIFT功能与灵长类动物视力下颞叶(IT)皮质中神经元的反应具有许多共同的特性。本文还描述了索引和模型验证的改进方法。
通过使用分级过滤方法,可以有效地识别尺度不变特征。第一阶段通过寻找高斯差函数的最大值或最小值的位置来确定尺度空间中的关键位置。每个点都用于生成特征向量,该特征向量描述相对于其比例空间坐标系采样的局部图像区域。通过模糊图像梯度位置,这些功能实现了局部变化的局部不变性,例如仿射或3D投影。该方法基于哺乳动物视觉的大脑皮层中复杂细胞行为的模型。所得的特征向量称为SIFT键。在当前的实现中,每个图像生成1000个SIFT键的数量级,此过程需要少于1秒的计算时间。
从图像派生的SIFT密钥在最近邻方法中用于索引以标识候选对象模型。首先通过霍夫变换哈希表,然后通过最小二乘法拟合最终确定模型参数,来确定与潜在模型姿势一致的键集合。当至少三个键在残差低的模型参数上达成一致时,有充分的证据表明存在物体。由于典型对象的图像中可能有数十个SIFT键,因此可能在图像中具有大量的遮挡,但仍保持较高的可靠性。
当前的对象模型表示为SIFT密钥的2D位置,可以进行仿射。在特征位置上进行足够的变化可以识别平面形状的透视投影,该平面投影距离相机最多60度旋转,或者允许3D对象最多20度旋转。