深度学习项目论文PapersWithCode

本文综述了2015年至2019年间深度估计领域的最新进展,包括使用多任务学习、金字塔立体匹配网络、神经RGB-D传感、自我监督学习等方法。探讨了基于深度学习的深度估计技术,如ResNet-50、GAN、LSTM的应用,以及如何结合多视角几何和神经网络实现部分监督训练。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

深度估计

  • [2019] Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics 链接

  • SGANVO: Unsupervised Deep Visual Odometry and Depth Estimation with Stacked Generative Adversarial Networks 链接
    Contribution:使用多个GAN加上一对双目的图像进行训练

  • [2018] Pyramid Stereo Matching Network 链接
    Contribution : 主要用到了空洞卷积、金字塔结构来处理双目视频

  • [2019] Neural RGB→D Sensing: Depth and Uncertainty from a Video Camera 链接
    Contribution:1.实现了多帧视频的输入,真正意义上实现相邻帧之间几何信息和神经网络的结合,改造costv_olume提出了DPV深度概率模型的方法 2.尝试引入类似卡尔曼滤波的网络结构,但是结果感人,归其原因没有实现真正的深度概率密度分布

  • [2015] Fully Convolutional Residual Network for Depth Estimation 链接
    Contribution:简单粗暴使用ResNet-50去训练深度,实际效果感人,速度也感人

  • [2019] Self-supervised Learning for Dense Depth Estimation in Monocular Endoscopy
    Download : https://arxiv.org/pdf/1902.07766.pdf
    Contribution:将传统的多视角几何融合到神经网络当中,实现了部分监督的效果去训练图像,缺陷:并有真正使用到相邻帧的几何关系,实际更多依赖的是来自SFM的三维点的监督

  • [2019] Unstructured multi-view depth estimation using mask-based multiplane representation 链接
    Contribution:使用到了多视角几何的知识,固定参考帧,用多张图进行匹配,同时使用(具有高置信度的)部分特征图的深度概率来进行训练,没有源码,从论文来看效果有待改进

  • [2019] A Survey on Deep Learning Architectures for Image-based Depth Reconstruction
    Download:https://arxiv.org/pdf/1906.06113v1.pdf
    Contribution:总结了截止2019年初的关于深度估计的多种方法(包括结合多视角几何的算法),里面有关于损失函数的汇总,是比较好的summary

  • [2019] Recurrent Neural Network for (Un-)supervised Learning of Monocular Video Visual Odometry and Depth 链接
    Contribution:结合LSTM、多视角几何算法,具有多帧信息,并且不依赖相机的姿态(网络自带姿态的估计),但是论文说法比较含糊,关键模块没说清(关于关于多帧输入,论文中只是说先前帧的信息在隐藏层中?),代码没有开源。

SFM

  • colmap Github 开源的SFM+MVS一体的开源重构库

特征嵌入

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值