这是一篇车辆细粒度识别的论文,它利用3D的bonding box来对3D包裹住的车辆对象拆分至一个平面,利用这个最终的imag进行训练,训练效果最好是在vgg16的分类精度达到84.13,追踪精度达到92.27。对于没有3D包围盒信息的,作者还提供了一种3D包围盒的预测算法。(尽管介绍这部分的写的也太不详细了,而且发布的源码来看也没有包含这部分,只包含了一份预测出的estimated_3DBB.pkl的文件:(里面是对应的八个3DBB坐标信息。)
在看这篇论文之前首先查了一下什么叫做细粒度识别,换句话说细粒度识别可以称为同一个类别内的识别,对于车辆的细粒度识别,就是识别出包括车辆模型的确切类型,模型与子模型,和该模型的年份等信息。下面来看这篇论文。
这篇论文主要提供了五个方法来提高进度,分别是Unpack, Color,ImageDrop, View, Rast。其中最重要的是Unpack方法,他跟在Color,和ImageDrop两个图像数据增强方法后面使用。
- Unpack
这个方法是对3D包围盒的拆包,首先有必要介绍一下该论文中的一篇reference对于车辆的3D包围盒的构造方法。
介绍之前,先说图像消失点(也称灭点)的概念我对这个概念纠结了好久,在我们得生活空间也即欧式空间,两个平行的直线是永远不会相交的,但在图像的投影平面中,两个平行的直线是会相交的,最简单的例子:
对于平行的铁轨会相交于图像的某一点,这个消失点是图像内,消失点也完全可以在图像外,并且有多个,

最低0.47元/天 解锁文章
3620

被折叠的 条评论
为什么被折叠?



