[论文阅读]Improving Fine-Grained Recognition of Vehicles using 3D Bounding Boxes in Traffic Surveilla

最新推荐文章于 2023-05-23 13:53:58 发布

原创

最新推荐文章于 2023-05-23 13:53:58 发布 · 1.2k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

这是一篇车辆细粒度识别的论文，它利用3D的bonding box来对3D包裹住的车辆对象拆分至一个平面，利用这个最终的imag进行训练，训练效果最好是在vgg16的分类精度达到84.13，追踪精度达到92.27。对于没有3D包围盒信息的，作者还提供了一种3D包围盒的预测算法。（尽管介绍这部分的写的也太不详细了，而且发布的源码来看也没有包含这部分，只包含了一份预测出的estimated_3DBB.pkl的文件：（里面是对应的八个3DBB坐标信息。）

在看这篇论文之前首先查了一下什么叫做细粒度识别，换句话说细粒度识别可以称为同一个类别内的识别，对于车辆的细粒度识别，就是识别出包括车辆模型的确切类型，模型与子模型，和该模型的年份等信息。下面来看这篇论文。

这篇论文主要提供了五个方法来提高进度，分别是Unpack, Color,ImageDrop, View, Rast。其中最重要的是Unpack方法，他跟在Color,和ImageDrop两个图像数据增强方法后面使用。

Unpack

这个方法是对3D包围盒的拆包，首先有必要介绍一下该论文中的一篇reference对于车辆的3D包围盒的构造方法。

介绍之前，先说图像消失点（也称灭点）的概念我对这个概念纠结了好久，在我们得生活空间也即欧式空间，两个平行的直线是永远不会相交的，但在图像的投影平面中，两个平行的直线是会相交的，最简单的例子：

摘自网络

对于平行的铁轨会相交于图像的某一点，这个消失点是图像内，消失点也完全可以在图像外，并且有多个，

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。