基于视觉的车辆三维位置获取学习笔记

本文介绍了一种基于单张图片进行3D车辆定位和分析的方法DeepMANTA,该方法利用预先构建的三维模型从单一视角图像中恢复出车辆的三维位置和模型。文中还探讨了相关技术如RCNN的发展历程及其在计算机视觉领域的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近在为如何通过图像识别出整个车,并获取车的三维空间信息发愁。记录下看的东西。

1.Deep MANTA  A Coarse-to-fine Many-Task Network for joint 2D and 3D vehicle analysis from monocular image

通过预先构建的车辆三维模型,可以通过单张图片还原出车辆的3D位置和模型,这里有前人的翻译。这里是来自浙大的翻译和理解。

里面提到了RCNN,所以去找了一下,这篇把RCNN的前世今生说的很简洁,也让人实在感慨技术突破的巨大作用。

然后又在知网上发现很多,这里给了很多说明和链接。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值