1、3D Vehicle Detection Using Camera and Low-Resolution LiDAR
目前,光探测与测距(LiDAR)已广泛应用于自动驾驶汽车的感知和定位。然而,高分辨率的Li-DAR的成本仍然非常昂贵,而其低分辨率的对等物是更实惠的。因此,使用低分辨率的激光雷达代替高分辨率的激光雷达来完成自动驾驶感知任务是一种经济可行的解决方案。本文提出了一种基于低分辨率激光雷达和单目相机的三维目标检测框架。以低分辨率的LiDAR点云和单目图像为输入,深度补全网络能够生成密集点云,随后通过基于体素的网络进行处理,用于三维目标检测。实验结果表明,该方法比直接应用16线elidar点云进行目标检测效果明显优于直接应用16线elidar点云进行目标检测。无论是简单的还是中等的情况,我们的检测结果可以与64行高分辨率激光雷达相媲美。详细分析了该网络的体系结构和性能评估。
2、Robustness Enhancement ofObject Detection inAdvanced Driver Assistance Systems(ADAS)
本文提出了一种集成紧凑目标检测器和周边环境条件分类器的统一系统,以提高高级驾驶员辅助系统目标检测方案的鲁棒性。自动驾驶系统是为了提高自动驾驶系统的交通安全性和有效性而发明的,目标检测在自动驾驶系统中起着极其重要的作用。然而,由于部署阶段的高延迟和环境环境的变化,集成在adas中的现代目标探测器仍然不稳定。针对上述问题,提出了我们的系统。拟议的系统包括两个主要组成部分:(1)一种紧凑的单级目标探测器,与最先进的目标探测器相比,它有望具有相当的精度;(2)一个环境状态探测器,当自动驾驶汽车由于情况的重要性而需要人类行动时,它有助于向云发送预警信号。实证结果证明了该系统的可靠性和可扩展性。
3、Hallucination Improves Few-Shot Object Detection
学习从少量的注释实例中检测新目标具有重要的现实意义。当例子极其有限(少于三个)时,就会出现一种特别具有挑战性而又普遍的制度。改进少样本检测的一个关键因素是解决缺乏变化的训练数据。我们建议通过从基类转移共享的类内变异来为新类建立一个更好的变异模型。为此,我们引入了一个幻觉者网络,该网络可以学习在感兴趣区域(RoI)特征空间中生成额外的、有用的训练示例,并将其纳入现代目标检测模型。我们的方法产生了显著的性能改进的两个最先进的少样本目标检测器与不同的区域建议生成程序。特别是,我们在极具挑战性的COCO基准上实现了极少镜头的新技术状态。
4、Pedestrian Detection in 3D Point Clouds using Deep Neural Networks
行人检测是自动驾驶系统中确保驾驶员和行人安全的一项重要任务。这些算法所涉及的技术必须精确、稳健和可靠,无论环境条件如何。在摄像头无法正确捕捉场景的情况下,仅依靠RGB摄像头可能不足以识别道路环境。一些方法旨在弥补这些限制,将RGB摄像头与飞行时间(TOF)传感器相结合,如光探测和测距(LIDAR),它利用光脉冲将场景映射到3D点云。然而,只有少数作品专门使用激光雷达提供的三维几何信息来解决这个问题。在本文中,我们提出了一个基于PointNet++的架构来检测密集的3D点云中的行人。目的是探索单独的几何信息在行人检测系统中的潜在贡献。PointNet++是一种深度神经网络,可以从点云的几何形状中学习全局和局部特征。这允许识别每个类的不同模式。在我们的例子中,网络必须学会对行人进行分类,所以我们需要使用精确标记的行人和非行人点云簇作为输入来进行监督训练。因此,我们也提出了一个半自动的la-beling系统来生成一个具有groundtruth的点云数据集。该标记系统将行人和非行人标签从RGB图像转移到3D域。事实是,我们的数据集有RGB注册点云,使标签传输通过反向投影从2d边界框到点云,只有一个轻的人工监督验证结果。我们用得到的三维标记簇的几何形状训练PointNet++。评价结果证实了该方法的有效性,准确率和查全率均在98%左右。这证实了本文的假设,三维几何信息是神经网络学习在户外场景下检测行人的必要条件,从而证明了激光雷达传感器在这些系统中是必须的。
5、Local Relation Learning for Face Forgery Detection
随着人脸操作技术的快速发展,人脸伪造检测受到了数字媒体取证界的广泛关注。大多数现有的方法将人脸伪造检测作为一个分类问题,并利用二进制标签或操纵的区域掩码作为监督。但是,如果没有考虑局部区域之间的相关性,这些全局监督不足以学习一个广义特征,容易出现过拟合。为了解决这一问题,我们提出了一种基于局部关系学习的人脸伪造检测方法。具体来说,我们提出了一种多尺度补丁相似性模块(Multi-scale Patch SimilarityModule, MPSM),它可以度量局部区域的特征之间的相似性,形成一个鲁棒的、广义的相似模式。此外,我们提出了一种RGB-Frequency Attention Module (RFAM)来融合两个RGBand频域内的信息,以更全面的局部特征表示,进一步提高了相似模式的可靠性。大量实验表明,该方法的性能始终优于目前广泛使用的artson性能基准。详细的可视化结果显示了该方法的鲁棒性和可解释性。
552





