主要思想:使用神经网络对深度进行学习。一个粗尺度网络首先在全局上对场景深度进行预测。然后通过使用细尺度网络进行局部区域的优化。
缺点:早期直接用深度网络估计深度,只有卷积层,池化层,和全连接层最后得到的深度图分辨率太小
Coarse 网络是一个经典的AlexNet(NIPS 2012)结构,任务是使用场景的全局视角来预测整体深度图结构。网络的上几层是全连接层,因此可以包括整张图片的信息。同样的,底层和中间几层被设计通过最大池化操作降到一个小的空间维度,来连接图像不同部分。这样做了之后,这个网络能够整合整个场景全局的理解来预测深度。这样的针对全图的理解在单张图片中是需要的,因为这样可以有效地利用诸如消失点、物体位置、空间对齐等线索。局部线索(通常立体匹配)很难注意到这些重要的特征。
在Fine网络中,作者先采用大步长的卷积核将图片的大小变小之后,并没有再去降低特征的大小,而是采用了步长为1,大小为5的卷积核去进行特征提取并结合之前Coarse网络的结果得到最终预测的结果.这个网络只有卷积层和在第一层的边缘特征中有一个池化步骤。 在训练的时候,此网络先训练Coarse网络然后再固定C