Depth Map Prediction from a Single Image using a Multi-Scale Deep Network (2014 NIPS)

该博客介绍了如何使用多尺度深度网络从单个图像预测深度图。首先,粗尺度网络全局预测场景深度,然后细尺度网络优化局部区域。由于早期深度网络的分辨率问题,后续工作改进了网络结构,如使用VGG16,以提高预测精度。损失函数考虑了尺度不变性,确保了预测的质量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

主要思想:使用神经网络对深度进行学习。一个粗尺度网络首先在全局上对场景深度进行预测。然后通过使用细尺度网络进行局部区域的优化。

缺点:早期直接用深度网络估计深度,只有卷积层,池化层,和全连接层最后得到的深度图分辨率太小

 

      Coarse 网络是一个经典的AlexNet(NIPS 2012)结构,任务是使用场景的全局视角来预测整体深度图结构。网络的上几层是全连接层,因此可以包括整张图片的信息。同样的,底层和中间几层被设计通过最大池化操作降到一个小的空间维度,来连接图像不同部分。这样做了之后,这个网络能够整合整个场景全局的理解来预测深度。这样的针对全图的理解在单张图片中是需要的,因为这样可以有效地利用诸如消失点、物体位置、空间对齐等线索。局部线索(通常立体匹配)很难注意到这些重要的特征。

   在Fine网络中,作者先采用大步长的卷积核将图片的大小变小之后,并没有再去降低特征的大小,而是采用了步长为1,大小为5的卷积核去进行特征提取并结合之前Coarse网络的结果得到最终预测的结果.这个网络只有卷积层和在第一层的边缘特征中有一个池化步骤。 在训练的时候,此网络先训练Coarse网络然后再固定C

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值