[论文阅读]Improving Fine-Grained Recognition of Vehicles using 3D Bounding Boxes in Traffic Surveilla

  这是一篇车辆细粒度识别的论文,它利用3D的bonding box来对3D包裹住的车辆对象拆分至一个平面,利用这个最终的imag进行训练,训练效果最好是在vgg16的分类精度达到84.13,追踪精度达到92.27。对于没有3D包围盒信息的,作者还提供了一种3D包围盒的预测算法。(尽管介绍这部分的写的也太不详细了,而且发布的源码来看也没有包含这部分,只包含了一份预测出的estimated_3DBB.pkl的文件:(里面是对应的八个3DBB坐标信息。)

  在看这篇论文之前首先查了一下什么叫做细粒度识别,换句话说细粒度识别可以称为同一个类别内的识别,对于车辆的细粒度识别,就是识别出包括车辆模型的确切类型,模型与子模型,和该模型的年份等信息。下面来看这篇论文。

  这篇论文主要提供了五个方法来提高进度,分别是Unpack, Color,ImageDrop, View, Rast。其中最重要的是Unpack方法,他跟在Color,和ImageDrop两个图像数据增强方法后面使用。

  1. Unpack

 这个方法是对3D包围盒的拆包,首先有必要介绍一下该论文中的一篇reference对于车辆的3D包围盒的构造方法。

介绍之前,先说图像消失点(也称灭点)的概念我对这个概念纠结了好久,在我们得生活空间也即欧式空间,两个平行的直线是永远不会相交的,但在图像的投影平面中,两个平行的直线是会相交的,最简单的例子:

摘自网络
摘自网络

 

对于平行的铁轨会相交于图像的某一点,这个消失点是图像内,消失点也完全可以在图像外,并且有多个,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值