- 左右一致性检测(Left-Right Consistency, LRC)对实验效果的提升是很显著的,无论是视差图的视觉效果还是数据精度。很多时候LRC都是论文的遮羞布,在论文主体部分优势不明显的情况下,通过LRC依然能得到过得去的结果,从而掩盖了核心算法的孱弱。是的,一些不错的会议文章也是这么干的。这就是论文写作的小trick吧,也是一种潜规则了。[来源]
- G2O优化相机内参。[来源]
- 基于单幅图像的深度估计算法的目的是得到图像中每个像素点的深度信息,尽管二维图像存在深度丢失的问题,但是图像中的颜色、纹理、明暗、语义等结构信息间接地反映了场景的深度信息,可以通过对图像的特征进行提取,来建立图像的特征到图像深度的关系的模型,对其进行推断来得到图像的深度。[1]
- 2005 年,由 A.Saxena 等人提出的 make3D 方法是最早的方法之一。该方法首先对图像进行超像素分割,且将超像素视为一个平面,然后通过马尔可夫随机场对这些平面的相关关系进行建模,从而推断出每一个平面的深度。随后,Liu 等人将连续条件随机场(continuous conditional random field,CCRF)应用到深度估计问题的建模中,同样考虑了超像素对应的平面的相关关系。以上方法建模过程中使用的都是从图像中提取的手工特征,而这些特征并不能很好的代表场景的 3D 结构信息,故而这些方法的性能并不十分理想。[2]
- Liu 等人提出的DCNF-FCSP 模型将 CNN 与 CRF 统一于一个深度学习框架中。CNN 从图像中提取相关特征,而 CRF 可以根据相邻超像素的相似度使最终预测结果具有保平滑性与保边缘性。因为对图像进行了超像素分割,所以 CRF 的结点数锐减,使得 CRF 的最大化后验概率(maximum a posteriori,MAP)的精确推断过程在计算上可行,从而使得模型的推断过程最终有一个解析解。[2]
- 超像素的提出[3]。
- 点云配准,参考1。ICP算法的提出[4]。ICP和RANSAC算法流程[5]。
- 孪生网络、对抗网络、迁移学习。
- ResNetv1、ResNetv2。
[1]王媛媛. 基于卷积神经网络的图像深度估计研究[D].西安理工大学,2018. [2]李耀宇. 基于深度学习的单目图像深度估计[D].哈尔滨理工大学,2017. [3]Ren X , Malik J . Learning a classification model for segmentation[J]. Iccv, 2003, 1:10-17 vol.1. [4]Besl P J , Mckay N D . A method for registration of 3-D shapes[J]. IEEE Trans. Pattern Anal. Mach. Intell, 1992. [5]Pandey G , Mcbride J R , Savarese S , et al. Visually bootstrapped generalized ICP[C]// IEEE International Conference on Robotics & Automation. IEEE, 2013. |