【论文阅读】【三维目标检测】Pseudo-LiDAR from Visual Depth Estimation

最新推荐文章于 2025-09-15 11:22:27 发布

原创

最新推荐文章于 2025-09-15 11:22:27 发布 · 2.4k 阅读

·

6

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

2019年CVPR论文探讨了使用图像进行三维目标检测效果不佳的原因，指出问题在于前视图表示而非深度信息准确性。论文提出通过Depth Map恢复Pseudo LiDAR，结合图像和点云信息提升检测效果。实验表明，这种方法在某些场景下优于仅使用图像的检测方法，但仍不及激光雷达的精确度。

文章目录

检测结构
对使用Pseudo LiDAR有效性的解释
实验

2019CVPR

本文提出了一个重要观点：使用图像做三维目标检测，其效果差不是因为使用图像得到的深度信息不准确，而是因为使用前视图这种表示方式的问题。

由于本文并未提出什么新的网络，所以这篇paper的解读与其他的结构不太一样。

检测结构

在这里插入图片描述
上图为本文提出的检测结构，整体分为两步走，第一步通过计算Depth Map，恢复出Pseudo LiDAR，第二部使用融合图像和点云的方法检测三维物体。

Depth Map -> Pseudo LiDAR：
在这里插入图片描述
说白了就是将深度图(u, v, d)的表示方式转为点云的表示方式(x, y, z)。

然后就是对Pseudo LiDAR的处理，就是丢掉一些超出一定x，y，z边界的点，例如高于激光雷达1m的点丢弃掉等。

对使用Pseudo LiDAR有效性的解释

这块内容主要是在Data representation matters这一节中讲的，其实我对这一节的解释很不认可。

首先先说一下文中的解释：
文中首先提到了convolution有两个假设：

local neighborhoods in the image have meaning, and the network should look at local patches
all neighborhoods can be operated upon in an identi

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。