关于视觉3d目标检测学习像素深度的一点理解

文章探讨了在没有深度信息的像素坐标系中,深度学习如何通过图像识别物体种类、尺寸,利用小孔成像原理和相似三角形关系,推断出物体的真实深度。如果尺寸预测不准确,深度预测的准确性也会受到影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在真实世界的一个物体,可以通过相机矩阵将其投影到像素坐标系上

但是,在像素坐标系上的像素,由于相机的原理,导致它的深度信息已经没有了,所以原理上是没法得到其真实深度的(即3d位置)

那么现在的深度学习方法又为什么能预测出物体的深度呢?
个人理解:
大概的过程就是:

  1. 通过图像可以预测物体的种类
  2. 通过物体的种类以及其他一些特征可以预测物体的尺寸
  3. 根据成像原理,真实物体通过小孔成像原理,投射到像素平面,真实物体的两个点+相机中心+图像上两个点构成两个相似三角形,知道了物体的尺寸,根据相似三角形原理,物体实际尺寸和像素尺寸的比例,是与真实深度和相机焦距的比例一致的,因此物体尺寸有了,就可以预测出深度距离了
    如果真实物体的尺寸预测不准的话,大概率深度预测也不会准
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值