Depth Map Prediction from a Single Image using a Multi-Scale Deep Network (2014 NIPS)

胡涂胡话

于 2018-07-20 17:06:31 发布

阅读量505

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_40311211/article/details/81101568

版权

该博客介绍了如何使用多尺度深度网络从单个图像预测深度图。首先，粗尺度网络全局预测场景深度，然后细尺度网络优化局部区域。由于早期深度网络的分辨率问题，后续工作改进了网络结构，如使用VGG16，以提高预测精度。损失函数考虑了尺度不变性，确保了预测的质量。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

主要思想：使用神经网络对深度进行学习。一个粗尺度网络首先在全局上对场景深度进行预测。然后通过使用细尺度网络进行局部区域的优化。

缺点：早期直接用深度网络估计深度，只有卷积层，池化层，和全连接层最后得到的深度图分辨率太小

Coarse 网络是一个经典的AlexNet(NIPS 2012)结构，任务是使用场景的全局视角来预测整体深度图结构。网络的上几层是全连接层，因此可以包括整张图片的信息。同样的，底层和中间几层被设计通过最大池化操作降到一个小的空间维度，来连接图像不同部分。这样做了之后，这个网络能够整合整个场景全局的理解来预测深度。这样的针对全图的理解在单张图片中是需要的，因为这样可以有效地利用诸如消失点、物体位置、空间对齐等线索。局部线索（通常立体匹配）很难注意到这些重要的特征。

在Fine网络中，作者先采用大步长的卷积核将图片的大小变小之后，并没有再去降低特征的大小，而是采用了步长为１，大小为５的卷积核去进行特征提取并结合之前Coarse网络的结果得到最终预测的结果．这个网络只有卷积层和在第一层的边缘特征中有一个池化步骤。在训练的时候，此网络先训练Coarse网络然后再固定C

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。