2024年Occupancy热门工作汇总!30+工作都在这里了~

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

>>点击进入→自动驾驶之心星球vip交流群

1、 题目:MetaOcc: Surround-View 4D Radar and Camera Fusion Framework for 3D Occupancy Prediction with Dual Training Strategies

链接:https://t.zsxq.com/3sVbS

简介:首个基于半监督4D雷达与相机融合的占用预测方法!MetaOcc:基于环视4D雷达与摄像头融合的双训练策略3D占用预测框架

时间:2025-02-02T14:23:42.820+0800

2、 题目:LOMA: Language-assisted Semantic Occupancy Network via Triplane Mamba

链接:https://t.zsxq.com/lz62W

简介:AAAI 2025

时间:2024-12-12T20:01:01.645+0800

3、 题目:Fast Occupancy Network

链接:https://t.zsxq.com/8m3CB

简介:AMD提出的Fast Occupancy Network

时间:2024-12-11T23:31:50.149+0800

4、 题目:PVP: Polar Representation Boost for 3D Semantic Occupancy Prediction

链接:https://t.zsxq.com/ghqzD

简介:PVP:一种操作于极坐标系下的全新的3D多模态占用预测器

时间:2024-12-11T23:05:50.325+0800

5、 题目:Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction

链接:https://t.zsxq.com/7oZ1o

简介:nuScenes 和 KITTI-360最新SOTA!GaussianFormer-2

时间:2024-12-07T23:27:07.204+0800

6、 题目:Language Driven Occupancy Prediction

链接:https://t.zsxq.com/IlMIA

简介:LOcc:一个有效且具有良好泛化能力的开放词汇占用(OVO)预测框架

时间:2024-11-26T17:39:08.663+0800

7、 题目:Robust 3D Semantic Occupancy Prediction with Calibration-free Spatial Transformation

链接:https://t.zsxq.com/6YZmY

简介:一种鲁棒高效的3D语义占用(REO)预测方案

时间:2024-11-20T15:50:07.213+0800

8、 题目:ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction

链接:https://t.zsxq.com/LyaPl

简介:CVPR24占用和流量预测竞赛中获得了第二名方案

时间:2024-11-13T22:59:19.937+0800

9、 题目:OccLoff: Learning Optimized Feature Fusion for 3D Occupancy Prediction

链接:https://t.zsxq.com/q3lcL

简介:OccLoff框架:旨在“学习优化特征融合”以进行3D占用预测

时间:2024-11-07T22:44:30.415+0800

10、 题目:WildOcc: A Benchmark for Off-Road 3D Semantic Occupancy Prediction

链接:https://t.zsxq.com/zoIgr

简介:首个提供野外3D语义占用预测任务的密集占用标注基准

时间:2024-10-22T20:50:59.914+0800

11、 题目:TEOcc: Radar-camera Multi-modal Occupancy Prediction via Temporal Enhancement

链接:https://t.zsxq.com/eLFWq

简介:nuScenes最新占用预测SOTA! TEOcc: 一种基于Radar-相机多模态的时间增强占用预测网络

时间:2024-10-16T22:02:11.370+0800

12、 题目:SyntheOcc: Synthesize Geometric-Controlled Street View Images through 3D Semantic MPIs

链接:https://t.zsxq.com/Rma4v

简介:SyntheOcc: 通过扩散模型生成的系统,它通过在驾驶场景中以占据标签为条件来合成真实感和几何控制的图像

时间:2024-10-02T23:39:56.904+0800

13、 题目:CVT-Occ: Cost Volume Temporal Fusion for 3D Occupancy Prediction

链接:https://t.zsxq.com/BfszK

简介:CVT-Occ:利用体素在时间上的几何对应关系进行时间融合,从而提高3D占用预测的准确性

时间:2024-09-24T21:29:21.038+0800

14、 题目:UltimateDO: An Efficient Framework to Marry Occupancy Prediction with 3D Object Detection via Channel2height

链接:https://t.zsxq.com/x4pDq

简介:UltimateDO: 一种通过Channel2wheight将占用预测与3D目标检测相结合的高效框架

时间:2024-09-19T22:20:22.499+0800

15、 题目:Deep Height Decoupling for Precise Vision-based 3D Occupancy Prediction

链接:https://t.zsxq.com/ZJswR

简介:Occ3D-nuScenes最新SOTA!

时间:2024-09-13T22:12:53.419+0800

16、 题目:OccLLaMA: An Occupancy-Language-Action Generative World Model for Autonomous Driving

链接:https://t.zsxq.com/G6VSR

简介:OccLLaMA:一种占用-语言-动作生成世界模型

时间:2024-09-06T23:49:08.326+0800

17、 题目:AdaOcc: Adaptive-Resolution Occupancy Prediction

链接:https://t.zsxq.com/30PMW

简介:AdaOcc:一个更灵活、更有效的框架,能够在各种驾驶场景中提供准确的3D语义占用预测

时间:2024-09-02T22:28:49.806+0800

18、 题目:MambaOcc: Visual State Space Model for BEV-based Occupancy Prediction with Local Adaptive Reordering

链接:https://t.zsxq.com/RIm1P

简介:Mamba也来联合Occ了!MambaOcc:一种基于Mamba的占用预测方法

时间:2024-08-22T22:05:00.278+0800

19、 题目:Let Occ Flow: Self-Supervised 3D Occupancy Flow Prediction

链接:https://t.zsxq.com/RhmXX

简介:nuScenes和KITTI新SOTA方案!首个仅使用摄像头输入进行联合3D Occupancy和占用流预测的自监督方法

时间:2024-07-11T21:25:05.984+0800

20、 题目:UnO: Unsupervised Occupancy Fields for Perception and Forecasting

链接:https://t.zsxq.com/MAFz6

简介:UnO: 用于感知和预测的无监督Occupancy Fields

时间:2024-06-16T19:48:13.883+0800

21、 题目:OccSora: 4D Occupancy Generation Models as World Simulators for Autonomous Driving

链接:https://t.zsxq.com/47llC

简介:OccSora:一种基于扩散的4D占用生成模型,用于模拟自动驾驶3D世界的发展

时间:2024-06-01T14:11:38.729+0800

22、 题目:GaussianFormer: Scene as Gaussians for Vision-Based 3D Semantic Occupancy Prediction

链接:https://t.zsxq.com/Le48z

简介:GaussianFormer:基于视觉的高斯场景3D语义占用预测

时间:2024-05-28T22:32:21.969+0800

23、 题目:A Survey on Occupancy Perception for Autonomous Driving: The Information Fusion Perspective

链接:https://t.zsxq.com/cLobI

简介:自动驾驶中的Occupancy感知:从信息融合视角

时间:2024-05-09T22:19:41.784+0800

24、 题目:Vision-based 3D occupancy prediction in autonomous driving: a review and outlook

链接:https://t.zsxq.com/oU24P

简介:基于视觉的自动驾驶3D Occupancy预测研究综述与展望

时间:2024-05-07T21:52:55.841+0800

25、 题目:OccGen: Generative Multi-modal 3D Occupancy Prediction for Autonomous Driving

链接:https://t.zsxq.com/qp6nX

简介:OccGen: 面向自动驾驶的生成式多模态3D占用预测

时间:2024-04-24T22:11:58.033+0800

26、 题目:OccFeat: Self-supervised Occupancy Feature Prediction for Pretraining BEV Segmentation Networks

链接:https://t.zsxq.com/fTzpc

简介:OccFeat:预训练BEV分割网络的自监督占用特征预测

时间:2024-04-23T21:53:26.183+0800

27、 题目:OccFeat: Self-supervised Occupancy Feature Prediction for Pretraining BEV Segmentation Networks

链接:https://t.zsxq.com/fTzpc

简介:OccFeat:预训练BEV分割网络的自监督占用特征预测

时间:2024-04-23T21:53:26.183+0800

28、 题目:SparseOcc: Rethinking Sparse Latent Representation for Vision-Based Semantic Occupancy Prediction

链接:https://t.zsxq.com/NrFjp

简介:SparseOcc: 一个受稀疏点云处理启发的高效占用网络

时间:2024-04-16T22:43:35.132+0800

29、 题目:OFMPNet: Deep End-to-End Model for Occupancy and Flow Prediction in Urban Environment

链接:https://t.zsxq.com/px9cA

简介:OFMPNet: 城市环境中基于Occupancy 和流预测的深度端到端模型

时间:2024-04-08T22:40:57.049+0800

30、 题目:MonoOcc: Digging into Monocular Semantic Occupancy Prediction

链接:https://t.zsxq.com/lOvvg

简介:ICRA 2024

时间:2024-03-14T22:48:47.599+0800

31、 题目:FastOcc: Accelerating 3D Occupancy Prediction by Fusing the 2D Bird’s-Eye View and Perspective View

链接:https://t.zsxq.com/JYyLk

简介:Occ3D-nuScenes新SOTA!FastOcc:融合2D BEV和透视图加速3D占用预测

时间:2024-03-06T22:24:31.574+0800

32、 题目:OccFusion: A Straightforward and Effective Multi-Sensor Fusion Framework for 3D Occupancy Prediction

链接:https://t.zsxq.com/xVuDo

简介:OccFusion: 一种简单有效的多传感器3D占用预测融合框架

时间:2024-03-05T23:31:30.031+0800

33、 题目:Collaborative Semantic Occupancy Prediction with Hybrid Feature Fusion in Connected Automated Vehicles

链接:https://t.zsxq.com/BIQwr

简介:第一个用于协同3D语义占用预测的方法

时间:2024-02-22T22:34:09.506+0800

34、 题目:POP-3D: Open-Vocabulary 3D Occupancy Prediction from Images

链接:https://t.zsxq.com/D0Ye1

简介:POP-3D:基于图像的开放词汇3D占用预测

时间:2024-01-18T23:19:53.593+0800

35、 题目:S2TPVFormer: Spatio-Temporal Tri-Perspective View for temporally coherent 3D Semantic Occupancy Prediction

链接:https://t.zsxq.com/hneVS

简介:S2TPVFormer,这是TPVFormer的一个扩展,利用了一种时空Transformer架构,用于一致的3D语义占用预测

时间:2024-01-14T11:13:48.550+0800

36、 题目:Fully Sparse 3D Panoptic Occupancy Prediction

链接:https://t.zsxq.com/lAr0O

简介:SparseOcc:一种新颖的全稀疏全景占用网络

时间:2023-12-29T21:26:55.070+0800

坦白的说,这两年自动驾驶的前沿技术栈更新非常快,从BEV、OCC、无图到端到端用了不到两年时间,而现在各大厂商又瞄向VLA、闭环仿真、通用大模型等等,2025年会有新一批的领先玩家上桌,让我们拭目以待。自动驾驶之心始终认为保持终身学习才是不变应万变之法,打铁还需自身硬。而自动驾驶之心知识星球就是为了这个目的打造的,两年时间我们一直在路上,一直在进步。目前已经陪伴了近4000名小伙伴的日常学习和工作。在内容和知识分享这件事上,我们充满热情,绝不含糊。每天只需6毛钱就能拥有以上所有,且每天都在更新的自动驾驶私域知识宝库。

新年钜惠即将截止!微信加入智驾社区~

c202b16c0c3342d1cf703b1db1893f47.png

老用户五折续期优惠!微信扫码领取

a03e68cda270e39e0b31c0c92ec928dd.jpeg

如何保持竞争力?

保持竞争力的前提是个人技术和视野要常用常新,要让自己能搞定一个或多个模块,要常和行业内人士交流(比如经常参加行业大佬的直播)。一起为智驾站台,一起相信智驾的未来!最后真心推荐大家加入『自动驾驶之心知识星球』!

🔥【我们是谁】
『自动驾驶之心知识星球』目前最大自动驾驶学习交流私域社区,会员近4000人,行业大咖云集,60+合伙人和嘉宾,有问必答。

🔥【星球内有什么】
🎓1、35+自动驾驶方向学习路线;
🎓2、自动驾驶各方向面试100问汇总;
🎓3、每月精选问答,已积累近1000+条;
🎓4、100+大咖直播分享回放视频;
🎓5、100+自动驾驶行业报告;
🎓6、100+精选行业书籍;
🎓7、更多惊喜在星球内。

🔥【加入星球能获得什么】
🎓1、免费获得几十位专业嘉宾的问题解答(有问必答)
🎓2、永久免费浏览、下载星球内容(目前6500+,每天更新,会员过期后,过期前的内容可继续免费浏览下载)
🎓3、所有自动驾驶之心的付费课程8折优惠(价值3000元)
🎓4、直播视频免费无限期回放(现有100+场行业直播,未来一年持续邀请大咖分享)
🎓5、免费赠送优质课程视频(多门)
🎓6、星球积分榜前10名,获得丰富现金奖励
🎓7、免费咨询求职招聘相关问题
🎓8、加入专属VIP群,获得最新资讯

『自动驾驶之心知识星球』已经近4000人了!说句心里话,作为长期排名前十,内容和活跃度超过99%的平台,我们倾注了全部心血,社区就像个孩子一样,在大家细心的照料下,终于长大成人了。我们给大家准备了一个现金优惠大礼包,绝对超值。

新用户96元现金优惠!微信扫码领取

d14e4336a4b4aa26b64c00eea106ee0d.png

自动驾驶之心知识星球,创办于2022年7月份,致力于打造为自动驾驶行业中的 ”黄埔军校“,目前已近4000,聚集了近60+自动驾驶行业专家为大家答疑解惑。这是国内首个以自动驾驶技术栈为主线的交流学习社区,汇总了自动驾驶感知(目标检测、语义分割、车道线检测、BEV检测、Occupancy、在线地图、目标跟踪、多模态、多传感器融合等)、自动驾驶定位建图(高精地图、SLAM)、自动驾驶规划控制与预测、多传感器标定、端到端自动驾驶、自动驾驶仿真、自动驾驶开发、领域技术方案、AI模型部署落地等几乎所有子方向的学习路线!除此之外,还和数十家自动驾驶公司建立了1v1内推渠道,简历直达!这里可以自由提问交流,许多算法工程师和硕博日常活跃,解决问题!初衷是希望能够汇集行业大佬的智慧,在学习和就业上帮到大家!星球的每周活跃度都在国内前30,非常注重大家积极性的调度和讨论,欢迎加入一起成长!

星球内已经打磨出近30+的学习路线,涉及端到端自动驾驶、BEV感知、动态/静态障碍物检测、多传感器融合、多传感器标定、目标跟踪、模型部署与cuda加速、仿真等方向,沉淀了大量工程上的解决方案、学术上的优化思路!星球主要内容一览:

8701a20ae48d9f92109d661604c72f29.png

这些热门技术方向,星球里面全都有!

现在自动驾驶技术迭代期越来越短,从原来的单目3D到BEV,再到OCC,再到大模型和端到端,高阶智驾现阶段的技术点已经比较清晰。

O、热门方向大佬视频分享

27a3b2c8964b1eb26156ddfce29c57d8.png

8ed0ccf781384722c93d5257b067c818.png

c5ba515429c0e63dd11d1b950844874d.png

71edf6ac0a7e7a34ba1713f8e43f4ca6.png

一、端到端自动驾驶

1.前沿工作

  • 【Senna: 一种将LVLM(Senna-VLM)与端到端模型(Senna-E2E)相结合的自动驾驶系统】对两个数据集的广泛实验表明,Senna在规划性能上达到了最先进的水平;

  • 【Ramble:具有强化学习的高交互交通场景中的端到端驾驶】Ramble在CARLA Leaderboard 2.0上实现了路线完成率和驾驶评分的最新性能;

  • 【CARLA中的端到端自动驾驶全面综述】讨论了基于CARLA的最先进实现如何通过各种模型输入、输出、架构和训练范式解决端到端自动驾驶中遇到的各种问题;

  • 【端到端预测和规划最新SOTA!一种用于端到端自动驾驶的新交互机制:PPAD】。

2.报告和行业大佬直播分享

1b2372d8448af128e3e17bb835a19ea2.png ba72067908a4391c92da8861c6a98e35.png f55308bec60345c5537618bf05751604.png

大模型

1.前沿工作

  • 【全面回顾当前关于L(V)LM在自动驾驶应用方面的研究】重点关注四个关键领域:模块化整合、端到端整合、数据生成和评估平台。

  • 【自动驾驶中的大语言模型(LLM4AD):概念、基准、仿真和实车实验】LLMs在提升自动驾驶技术各个方面的显著潜力,包括感知、场景理解、语言交互和决策;

  • 【基于 LLM 驱动的鲁棒 RL 自动驾驶数据合成与策略调整】RAPID能够有效将LLM的知识整合到缩减版的RL策略中,以高效、适应性强且鲁棒的方式运行;

  • 【大型语言模型会成为自动驾驶的灵丹妙药吗?】本文对LLM在自动驾驶系统中的潜在应用进行了详尽的分析。

2.报告和行业大佬直播分享

fb1caad276ebdb35e4a06be2e4d45fa3.png 8241e0a5aee415b6908f25c777d86c21.png

BEV感知

1.前沿工作

  • 【nuScenes和nuScenes最新SOTA!】Focus on BEV: 基于自标定周期视图变换的单目BEV图像分割;

  • 【MambaBEV:一种基于mamba2的BEV目标检测】还采用了端到端的自动驾驶范式来测试该模型的性能。模型在nuScenes数据集上表现出了相当好的结果:基础版本达到了51.7%的NDS;

  • 【QuadBEV: 高效的多任务感知框架】它利用四个关键任务——3D目标检测、车道检测、地图分割和占用预测——之间共享的空间和上下文信息。

  • 【nuScenes-360和DeepAccident-360最新SOTA!】OneBEV:利用一幅全景图像进行鸟瞰语义建图!在nuScenes-360和DeepAccident-360上分别达到了51.1%和36.1%的mIoU,取得了最先进的性能。

2.报告和行业大佬直播分享

9f891667f905bc56c85144c7448ca2aa.png 2cc1b11b073609ffaa46a63500728e8c.png

Occupancy感知

1.前沿工作

  • 【OccLoff框架:旨在“学习优化特征融合”以进行3D占用预测】具体提出了一种稀疏融合编码器和熵掩模,该编码器可以直接融合3D和2D特征,从而提高模型的准确性,同时减少计算开销;

  • 【nuScenes最新占用预测SOTA! TEOcc: 一种基于Radar-相机多模态的时间增强占用预测网络】所提出的时间增强分支是一个即插即用的模块,能够轻松集成到现有的占用预测方法中以提升占用预测的性能;

  • 【SyntheOcc: 通过扩散模型生成的系统,它通过在驾驶场景中以占据标签为条件来合成真实感和几何控制的图像】

  • 【RELIOCC:一种旨在增强基于相机的占用网络可靠性的方法】首次从可靠性角度对现有的语义占用预测模型进行全面评估。显著提高了模型的可靠性,同时保持几何和语义预测的准确性。

2.报告和行业大佬直播分享

f0850ad25c5c8ada61337e54ab1ebc06.png 188a567aa2b904ea8dc9dcfe8eaa4159.png e6d0cdf32cdf6486d07ccc74bf000ed1.png

世界模型

1.前沿工作

  • 【探索自动驾驶中视频生成与世界模型之间的相互作用:一项调查】探讨了这两种技术之间的关系,重点分析它们在结构上的相似性,尤其是在基于扩散的模型中,如何促进更准确和一致的驾驶场景模拟;

  • 【从有效多模态模型到世界模型:探讨了MLMs的最新发展和挑战,强调它们在实现人工通用智能和作为通向世界模型的路径中的潜力】;

  • 【nuPlan闭环规划新SOTA!AdaptiveDriver:一种基于模型预测控制(MPC)的规划器,可以根据BehaviorNet的预测展开不同的世界模型】将测试误差从6.4%减少到4.6%,即使应用于从未见过的城市;

  • 【Vista:一个具有高保真度和多功能可控性的可泛化驾驶世界模型!】通过高效的学习策略,结合了一套多功能的控制方法,从高层次的意图(命令、目标点)到低层次的操作(轨迹、角度和速度),在超过70%的比较中优于最先进的通用视频生成器,并且在FID上超过最佳驾驶世界模型55%,在FVD上超过27%。

2.报告和行业大佬直播分享

3c84eda44b3584999aed81e40741da95.png 9f5f860d38b2f716fcc096fa6088cc9f.png f25e4d79e902732d421959312a8900d2.png

自动驾驶仿真

1.前沿工作

  • 【IGDrivSim,一个基于Waymax仿真器的基准】证明人工专家与自动驾驶智能体之间的感知差距会妨碍安全和有效驾驶行为的学习;

  • 【WorldSimBench:双重评估框架来评估世界仿真器】包括显式感知评估和隐式操作评估,涵盖了从视觉角度的人工偏好评估和具身任务中的动作级评估,涉及三个代表性的具身场景:开放式具身环境、自动驾驶和机器人操作;

  • 【CARLA2Real,这是一个易于使用的公共工具(插件),适用于广泛使用的开源CARLA仿真器】;

  • 【2024最新,自动驾驶框架和仿真器综述】本文回顾了开源和商业自动驾驶框架及仿真器,介绍并比较了它们的特点和功能等,还从硬件不足、自动驾驶算法、场景生成、V2X、安全与性能以及联合仿真等角度,提出了AD框架和仿真器在近期未来的有前景的研究方向。

2.报告和行业大佬直播分享

9e335fbb66379206d1aa25c7bccf7a12.png 2c706233519938307aed7a7a317728be.png ed2be96e776615b860bd94d35be623d1.png

本文内容均出自『自动驾驶之心知识星球』,欢迎加入交流!

新用户96元现金优惠!微信扫码领取

24a17b52705f5d348042e53465bd5412.png

老用户五折续期优惠!微信扫码领取

9728a0dbb3e2b317af2953478de38a39.jpeg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值