
论文
文章平均质量分 86
骆驼穿针眼
这个作者很懒,什么都没留下…
展开
-
【论文阅读】Far3D: Expanding the Horizon for Surround-view 3D Object Detection
论文: https://arxiv.org/pdf/2308.09616代码: https://github.com/megvii-research/Far3DA: 这篇论文提出了一个名为Far3D的新型3D对象检测框架,旨在解决从环视图像中进行长距离3D对象检测的挑战。尽管现有的基于环视图像的3D对象检测方法在成本低廉和应用广泛方面取得了显著进展,但它们主要集中在近程感知范围,而对远程检测的探索较少。直接将现有方法扩展到长距离检测面临如下挑战:计算成本高:随着检测范围的扩大,需要处理的数据量和计算量显著原创 2024-08-13 11:58:58 · 1204 阅读 · 0 评论 -
【论文阅读】Exploring Object-Centric Temporal Modeling for Efficient Multi-View 3D Object Detection
query 级别的时许融合原创 2024-08-06 13:33:28 · 690 阅读 · 0 评论 -
【论文阅读】PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images
引入任务特定的查询(task-specific queries),例如车道检测的3D锚定车道和BEV分割的seg查询,这些查询在不同的空间中初始化,并与transformer解码器中的多视图图像特征进行交互。通过3D坐标对齐(3D Coordinates Alignment)实现不同帧之间的时间对齐,将上一帧的3D坐标转换到当前帧的坐标系中,以增强目标定位和速度估计。改进原有的3D位置嵌入(3D PE),通过FPE使3D PE依赖于输入图像数据,利用2D图像特征提供的信息(如深度)来指导查询学习。原创 2024-08-03 16:41:09 · 1215 阅读 · 0 评论 -
【论文阅读】PETR: Position Embedding Transformation for Multi-View 3D Object Detection + 代码
在本文中,我们开发了用于多视图 3D 对象检测的位置嵌入变换(PETR)。PETR 将 3D 坐标的位置信息编码为图像特征,产生 3D 位置感知特征。对象查询可以感知 3D 位置感知特征并执行端到端对象检测。PETR 在标准 nuScenes 数据集上实现了最先进的性能(50.4% NDS 和44.1% mAP),并在基准测试中排名第一。它可以作为未来研究的简单而强大的基线。原创 2024-07-03 21:19:58 · 1384 阅读 · 1 评论 -
【论文阅读】COTR: Compact Occupancy TRansformer for Vision-based 3D Occupancy Prediction
为了解决这些问题,论文提出了一种名为Compact Occupancy TRansformer(COTR)的方法,它包括一个几何感知的占用编码器和一个语义感知的组解码器,以重建一个紧凑的3D OCC表示。总结来说,COTR通过提出紧凑的3D占用表示和语义感知的组解码器,有效地解决了3D占用预测中的几何信息丢失、计算成本高和语义可区分性差的问题。现有的3D占用表示缺乏语义可区分性,这限制了网络成功识别稀有物体的能力,这部分是由于数据集中的类别不平衡问题导致的。原创 2024-06-21 11:31:47 · 1096 阅读 · 0 评论 -
【论文阅读】Co-Occ: Coupling Explicit Feature Fusion With Volume Rendering Regularization for Multi-Modal
论文:https://arxiv.org/pdf/2404.04561v1代码:https://github.com/Rorisis/Co-Occ?原创 2024-06-20 12:05:25 · 1161 阅读 · 0 评论 -
Springer参考文献按照出现顺序排序
参考链接。原创 2024-06-14 10:51:32 · 888 阅读 · 0 评论