
深度、位姿估计
文章平均质量分 80
一只飞鱼fy
计算机视觉方向,关注SLAM、目标跟踪、多传感器融合定位以及深度学习与机器学习领域
展开
-
论文笔记-深度估计(3)Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale...
Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale Convolutional Architecture 这篇文章是eigen 2015年的新文章,基于同样的模型,同样的初始化和大概相同的参数,可以用来得到深度,表面法向量或语义标签。1.网络介绍它的Pipeline如图: 三个stage的网原创 2017-12-29 23:50:56 · 4253 阅读 · 2 评论 -
论文笔记-Sparsity Invariant CNNs
Sparsity Invariant CNNs 这篇文章提出了一个稀疏卷积网络框架,从稀疏的深度图中补全深度(depth completion)。这个稀疏卷积网络框架能够处理不同稀疏程度的深度数据。此外本文由kitti数据生成了一个对应的rgbd数据来用于训练。此处的稀疏卷积网络指的是应对稀疏输入的网络,而非用drop等方法使得网络参数更加稀疏(模型压缩)。深度补全大致分两个派别:有图像...原创 2018-04-19 11:47:20 · 1636 阅读 · 7 评论 -
论文阅读: GeoNet: Unsupervised Learning of Dense Depth, Optical Flow and Camera Pose(CVPR2018)
CVPR2018_GeoNet: Unsupervised Learning of Dense Depth, Optical Flow and Camera Pose 提出了一个联合估计深度、光流和pose的网络。 ,这是在left-right consistency的无监督估计、sfmlearner的基础上开展的又一作品。该论文主要贡献点: - 提出了一个几何一致性代价(geometr...原创 2018-04-17 20:33:47 · 2707 阅读 · 0 评论 -
论文笔记-深度估计(6)-Unsupervised Learning of Depth and Ego-Motion from Video
CVPR2017_Unsupervised Learning of Depth and Ego-Motion from Video 这是一篇从一段视频中恢复场景深度和相机pose的论文。他可能是第一篇用深度学习的方法从一段视频中恢复camera的pose的方法,它用两个网络(严格意义上是3个网络,下文赘述)分别/独自无监督地估计单帧的深度,和视频序列中的camera的pose变化。最终得到的原创 2018-01-03 00:47:02 · 9616 阅读 · 17 评论 -
论文笔记-深度估计(5)Unsupervised Monocular Depth Estimation with Left-Right Consistency
ECCV2016_Unsupervised Monocular Depth Estimation with Left-Right Consistency 本文采用无监督学习(没有ground truth)的方法来估计深度,基本思路是匹配好左右视图的像素,得到disparity map。根据得到的视差disparity,由d = bf/disparity,算出depth map。本文能实现在35m...原创 2018-01-01 15:38:58 · 6979 阅读 · 21 评论 -
论文笔记-深度估计(7)-CNN-SLAM Real-time dense monocular SLAM with learned depth prediction
CVPR2017_CNN-SLAM Real-time dense monocular SLAM with learned depth prediction关键词:基于CNN的单张图深度估计,语义SLAM,半稠密的直接法SLAM作者提出了一个利用CNN结合SLAM的应用,其SLAM过程如上图,具体解释如下:作者首先筛选出关键帧,在关键帧上用训练好的CNN网络[1]来预测单帧图深度值得到深度图,并以原创 2018-01-05 22:11:40 · 6759 阅读 · 0 评论 -
论文笔记-深度估计(4) Semi-Supervised Deep Learning for Monocular Depth Map Prediction
CVPR2017_Semi-Supervised Deep Learning for Monocular Depth Map Prediction这是一篇用双目进行无监督学习估计深度的论文。对一幅图进行有监督训练进行深度估计时,由于采集设备的局限,并非图像的每个像素都有对应的真实值。于是作者提出在图像有真实值的地方进行监督学习,无真实值的地方进行无监督学习(最终作者发现对整个图像都进行无监...原创 2017-12-30 15:40:42 · 4069 阅读 · 12 评论 -
论文笔记-深度估计(1)Depth Map Prediction from a Single Image using a Multi-Scale Deep Network
Depth Map Prediction from a Single Image using a Multi-Scale Deep Network作者认为以前估计深度的方法大概是基于几何代数、优化求解的方法来获得空间信息,但对于单张图片,仅仅基于几何信息是无法判断它的真实尺度的,因为没有先验信息的话,它的尺度是无法进行估计的。单张图深度估计,以人为例,需要综合考虑线条角度,透视关系,物体大小,图像位原创 2017-12-29 22:05:26 · 3671 阅读 · 4 评论 -
论文笔记-深度估计(2) Fully Convolutional Networks for Semantic Segmentation
1.介绍该文讲述的是语义分割,但思路和框架和深度恢复是十分相似的,毕竟当前语义和深度问题本质上是一个像素级的分类问题。从该文3000+引用用量也可见该文章的巨大启发效果。所谓全卷积网络,是指由仅由卷积层、池化层和非线性激活函数层交错组织起来的网络。作者的贡献在于将非常热门且有效地做分类的卷积网络应用于语义分割中。整个框架是接受整张图像作为输入,用卷积做一个coarse的分类输出,然后将这些输出与每个原创 2017-12-29 23:48:03 · 2090 阅读 · 0 评论 -
论文阅读-位姿估计-SE3-Nets Learning Rigid Body Motion using Deep Neural Networks
SE3-Nets Learning Rigid Body Motion using Deep Neural Networks(1) - 输入:三维点;系统输入(如推力); - 输出:三维点该论文只针对三维点云输入(RGBD等),来求解每帧中目标物体的刚体变换关系(SE(3), pose)。在这些深度学习框架的位姿估计问题中,旋转都使用旋转向量(3维度)的方式。以及需要分割的个数(?...原创 2018-04-19 17:34:33 · 1672 阅读 · 0 评论