0.单目3D检测任务
( c , x , y , z , w , l , h , θ ) (c,x,y,z,w,l,h,\theta) (c,x,y,z,w,l,h,θ)
θ \theta θ: 目标在三维空间中相对于水平方向的航向信息

1.坐标系转换关系:

1.1.像素坐标系
o − u , v o-u,v o−u,v:
描述物体在数字图像中的位置,单位为像素(pixel),该坐标系以图像顶点作为坐标原点,u、v 轴分别平行于图像坐标系的 x、y 轴。
1.2图象坐标系
O − x , y O-x,y O−x,y:
反映了成像过程中二维-三维的投影关系,通过连续的实际物理量描述物体在图像平面中的位置,单位为毫米,以垂直于图像平面的相机光轴和图像平面的交点作为坐标原点,由于相机光心往往存在偏移,因此该原点通常并不是图像中心
1.3相机坐标系:
O c − X c , Y c , Z c O_c-X_c,Y_c,Z_c Oc−Xc,Yc,Zc: 主要是和其他传感器、物体的位置做区分。
描述空间中目标物体相对于相机的位置而引入的坐标系,单位为米(m),坐标系原点在相机光心,规定垂直于图像平面的相机光轴为Zc轴正方向,垂直向下为Yc正方向,按右手坐标系来建立坐标系.
kitti数据集中相机坐标系如图所示:

1.4.世界坐标系
O w − X w , Y w , Z w O_w-X_w,Y_w,Z_w Ow−Xw,Yw

文章详细阐述了3D目标检测中不同坐标系的转换,包括像素坐标、图像坐标、相机坐标和世界坐标,以及它们之间的转换关系。同时,介绍了Kitti数据集的文件结构,如calib文件中的相机内外参矩阵,以及label文件中的物体标签信息,包括类别、截断、遮挡程度、观察角度等。
最低0.47元/天 解锁文章
3770

被折叠的 条评论
为什么被折叠?



