《Structure-Guided Ranking Loss for Single Image Depth Prediction》论文笔记-优快云博客

本文链接：https://blog.youkuaiyun.com/m_buddy/article/details/117638930

本文介绍了如何使用结构引导的排名损失改进深度估计方法。通过结合分割结果，提出边缘引导和实例级别的采样策略，增强损失函数，提高深度图预测的边缘清晰度和目标内部一致性。实验表明，这种方法在边缘和目标内部的深度预测性能得到显著提升。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 概述

导读：在这篇文章中提出了一种在监督深度估计方法中的损失函数。该方法是属于pair-wise ranking loss族的，文章通过利用目标的分割结果提出了一些新的采样策略，也就是低层次的边缘采样与目标实例级别的采样。从而极大增强了损失函数的约束能力，提升了最后深度图预测在边缘部分的锐化成都，以及目标内部的一致性内在属性。

文章将之前一些方法的损失函数进行比较，其结果在边缘与目标内部均得到了不错的提升，见下图所示：
在这里插入图片描述
理解下面的内容，需要的背景知识：

论文：Single- image depth perception in the wild
读书笔记：Single-Image Depth Perception in the Wild笔记
论文：Monocular relative depth per- ception with web stereo data supervision

2. 方法设计

2.1 original pair-wise ranking loss

文章中使用到的深度表达为inverse depth，RGB的图像经过网络之后得到估计出来的深度:
$P = F (I)$
在之前的论文中对于pair-wise的损失函数描述为：
$\phi(p_0-p_1) = \begin{cases} log(1+exp(-l(p_0-p_1))), & \text{$l\neq0$} \\[2ex] (p_0-p_1)^2, & \text{$l=0$} \end{cases}$
其中采样过程中正负样本的判别条件为：
$\begin{cases} +1 & \text{$p_0^{*}/p_1^{*}\ge1+\tau$} \\[2ex] -1, & \text{$p_0^{*}/p_1^{*}\le\frac{1}{1+\tau}$} \\[3ex] 0, & \text{otherwise} \end{cases}$