作者:小张Tt | 来源:3D视觉工坊
在公众号「3D视觉工坊」后台,回复「原论文」可获取论文pdf和代码链接。
添加微信:dddvisiona,备注:三维测量,拉你入群。文末附行业细分群。
本文提出了一种新颖的归一化设备坐标场景完成网络(NDC-Scene),用于解决单目三维语义场景完成(SSC)中的几个关键问题。通过将二维特征图扩展到归一化设备坐标空间,而不是直接扩展到世界空间,以及使用深度自适应双解码器进行上采样和融合,提出的方法在单目SSC任务中表现出色,并在室外SemanticKITTI和室内NYUv2数据集上优于最先进的方法。
读者理解:
本文提出了一种新的方法,用于从单个图像中预测复杂的语义和几何形状,而无需3D输入。作者指出了当前最先进方法中存在的几个关键问题,包括射线到3D空间中投影的2D特征的特征模糊性,3D卷积的姿态模糊性以及不同深度层次上3D卷积中的计算不平衡性。为了解决这些问题,作者设计了一种新颖的规范化设备坐标场景补全网络(NDC-Scene),通过逐步恢复深度维度来将2D特征图直接扩展到规范化设备坐标(NDC)空间,而不是直接扩展到世界空间。实验结果表明,将大部分计算从目标3D空间转移到提议的规范化设备坐标空间有助于单眼SSC任务。此外,作者设计了一个深度自适应双解码器,用于同时上采样和