欢迎访问我的博客首页。
1. 单目深度估计
单目深度估计包括深度预测(Depth Prediction)与深度补全(Depth Completion)。
2. 数据集
2.1 KITTI 数据集
KITTI 数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合制作。其用于深度预测的 depth prediction 子集的开发工具可以在 这里 下载,里面有对数据集的说明和转换代码。
KITTI 的深度值保存为 uint16 的 png 图像。像素值为 0 代表没有标注值,把非 0 的像素值转换为浮点类型再除以 256.0 就得到以米为单位的深度值。KITTI 的深度值在 80 米内。
2.2 NYU 数据集
来自纽约大学的数据集。
2.3 数据增广
因为有深度图,所以数据增广不要使用仿射变换之类,一般只对图像做旋转、裁剪。
3. 效果评估
深度预测的评估标准有多项,下面以 BTS 算法的论文为例来说明:

图 3.1 来 自 B T S 算 法 论 文 中 的 数 据 图\ 3.1\ 来自 BTS 算法论文中的数据 图 3.1 来自BTS算法论文中的数据
3.1 带阈值的精确率
假设 d i d_i di 和 d i ~ \tilde{d_i} di~ 分别表示来自标注数据的深度值和预测的深度值, δ \delta δ 定义为
δ = m a x ( d i d i ~ , d i ~ d i ) , (3.1) \delta = max(\frac{d_i}{\tilde{d_i}}, \frac{\tilde{d_i}}{d_i}), \tag{3.1} δ=max(di~di,did

本文介绍了单目深度估计,包括深度预测和深度补全,详细讨论了KITTI和NYU数据集,以及数据增广的注意事项。评估标准如带阈值的精确率、AbsRel、SqRel、RMSE和RMSElog等被用来衡量模型性能。
最低0.47元/天 解锁文章
1071





