通过训练卷积神经网络比较图像块的立体匹配
project主页:https://github.com/jzbontar/mc-cnn
基于patch的提取与比较,学习其相似性得到一个matching cost,并将正确匹配的patch定义为正样本,其他为负样本。
后处理包括:cross-based cost aggregation, semiglobal matching, a left-right consistency check, subpixel enhancement, a median filter, and a bilateral lter.
fast 和accurate两个版本
LeCun经典论文
摘要
我们提出了一种从经过矫正的图像对中提取深度信息的方法。我们的方法集中在许多立体视觉算法的第一阶段:匹配代价计算。我们通过使用卷积神经网络进行小图像块的相似性度量来解决这个问题。我们使用相似和不相似的图像对构建二元分类数据集来进行有监督的训练。针对这个任务,我们检测了两个网络架构:一个是速度导向的, 另一个是准确性导向的。卷积神经网络的输出用于初始化立体匹配代价。一系列后处理步骤如下:基于交叉的代价聚合,半全局匹配,左右一致性检查,亚像素增强,一个中值滤波器和一个双边滤波器。我们用KITTI 2012,KITTI 2015和 Middlebury的立体视觉数据集来评估我们的方法,并发现它在所有的三大数据集中的表现均优于其他方法。
1.介绍
考虑以下问