- 博客(4682)
- 收藏
- 关注
转载 即将开课!面向量产的端到端小班课,上岸高阶算法岗位~
由于无法保证模型直出会有100%的准确率,因此会通过一些轨迹的平滑优化算法来使得最终输出的轨迹更加的稳定和可靠,本章会介绍目前一些常用的轨迹平滑算法,既有多模态轨迹打分搜索的算法,也有轨迹平滑的算法。最后的一章重点会对量产的一些经验进行分享,会从数据、模型、场景、规则等多个视角来剖析如何使用合适的工具和手段解决相应的问题,当面临一个实际的可落地的系统时,如何更合理的选用不同的策略和方法,从而能够快速提升一个系统的能力边界。而在端到端时代,感知任务的合并,规控算法的learning化已是绝对的主流。
2025-11-27 08:02:09
9
原创 闭环训练终于补上了!AD-R1:世界模型端到端闭环强化学习新框架(澳门大学&理想等)
实验采用的数据集比例为80%的真实nuScenes数据与20%的合成反事实数据——该比例通过实证验证确定,既能提供充足的故障样本以修正乐观偏差,又不会显著偏离真实驾驶动态的模型先验。在AD-R1框架中,该公正世界模型作为内部评估器,使智能体能够在安全的离线环境中从“想象故障”中学习,最终大幅减少闭环仿真中的安全违规事件。为安全高效地获取该奖励信号,现有方法依赖外部仿真器,但如前文所述,这些仿真器存在局限:图形引擎固有的“仿真到现实差距”、2D布局仿真器的非交互性,或基于重建的环境的静态性与高成本。
2025-11-27 08:02:09
285
转载 面向工业界的3DGS全栈学习路线图(前馈GS等)
所以本章节先从计算机图形学的基础讲起,三维空间的隐式表达和显式表达、渲染管线、光线追踪、辐射场渲染都是什么,这些技术概念和3DGS的联系是什么。整体上第二章的设计思路是带大家先打好基础,先详细梳理3DGS的原理部分及核心伪代码,接着讲解动态重建、表面重建、鱼眼重建和光线追踪的经典文章和最新的算法,由点及面层层深入。Chris:QS20 硕士,现任某Tier1厂算法专家,目前从事端到端仿真、多模态大模型、世界模型等前沿算法的预研和量产,参与过全球TOP主机厂仿真引擎以及工具链开发,拥有丰富的三维重建战经验。
2025-11-27 08:02:09
10
转载 毫末智行突然原地解散!宇宙第一正式下线
作为长城汽车内部孵化的自动驾驶子公司,其核心团队融合了长城汽车内部的技术骨干,以及来自百度、华为等科技公司的自动驾驶人才。昨日(11月22日),社交媒体传出消息,一贯执行「大小周」政策的某北方智驾公司,在周六全员上班时,突然通知「下周一开始全员不用到公司,也不用打卡」。从毫末智行官方公众号来看,自今年6月开始,已经没有了公司自身资讯,而是只有行业资讯整理。到了今年,除了董事长张凯被传离职外,该公司各大技术骨干、公关负责人纷纷离职,其中包。去年,毫末智行曾进行大面积裁员,职能部门裁掉约1/3甚至近半。
2025-11-27 08:02:09
5
转载 学会模仿,2周就能搞定一篇SCI
无论你目标是CCF-A/B/C、SCI1-4区,还是EI会议,这些 “大牛导师” 都从选题、调研、idea验证、代码、实验、润色、投稿、直至中稿一站式科研服务。无论你目标是CCF-A/B/C、SCI1-4区,还是EI会议,这些 “大牛导师” 都从选题、调研、idea验证、代码、实验、润色、投稿、直至中稿一站式科研服务。深耕自动驾驶、具身智能、机器人 方向多年。A:我们有精准匹配系统:填完咨询表后,学术顾问会根据你的研究方向、目标期刊、基础水平,从300+导师中筛出3-5位最契合的,你选满意的再开始辅导。
2025-11-26 08:02:47
20
转载 交大一篇自动驾驶在线高精地图综述,中稿TITS!
车载相机与激光雷达的算力红利,使“边行驶边建图”成为可行路线:通过传感器在线感知,在鸟瞰视角下即时恢复车道线、路缘、交通标志等矢量要素,从而既保留高精地图的几何—语义一致性,又摆脱对全局底图的依赖,为后续定位、预测与规划提供轻量化、可差分更新的局部先验。由此,局部矢量化高精地图构建(LV-HDMC)应运而生,以有序点集表示地图实例,天然对齐下游控制所需的连续参数曲线,成为连接“重地图”与“无地图”范式的关键桥梁。最后,综述还深入剖析了当前局部矢量建图任务面临的主要问题,并对其未来的发展方向进行了全面展望。
2025-11-26 08:02:47
57
原创 轻舟智航最新!GuideFlow:端到端轨迹规划新方案,超越一众SOTA......
其核心创新在于将安全约束直接嵌入生成过程的策略:(1)速度场约束(CVF):采用预定义的、满足约束的速度场,主动修正模型预测的速度场,引导结果满足约束;(3)EBM流优化(RFE):通过统一流匹配架构与能量基模型(EBM),赋予模型在数据流形内自主探索的能力,使其能够“发现”满足约束的结果。如图4所示,在多种驾驶场景下的视觉对比表明,本文提出的GuideFlow方法相比DiffusionDrive具有显著优势:GuideFlow能生成满足约束的轨迹,在大幅降低碰撞风险的同时,严格遵守车道行驶规则。
2025-11-26 08:02:47
219
原创 浙大一篇中稿AAAI‘26的工作DiffRefiner:两阶段轨迹预测框架,创下NAVSIM新纪录!
实验结果表明,DiffRefiner达到了当前最优性能:在NAVSIM v2数据集上达到87.4的EPDMS分数,在Bench2Drive基准测试中获得87.1的驾驶分数(DS)和71.4%的成功率(SR),在两个公开基准测试中均创下新纪录。如表1所示,本文的框架实现了新的最先进性能,大幅超越了之前的最佳方法,在ResNet34骨干网络下提升了3.7%,在V2-99骨干网络下提升了1.6%。相比之下,本文的门控机制自适应地平衡了它们的贡献,实现了最佳性能,证实了自适应特征融合的优势。
2025-11-25 08:01:36
176
转载 留给端到端和VLA的转行时间,应该不多了......
现任国内TOP主机厂算法专家,目前从事端到端、大模型、世界模型等前沿算法的预研和量产,并已主持和完成多项自动驾驶感知和端到端算法的产品量产交付,拥有丰富的端到端算法研发和实战经验。目前从事多模态感知、自动驾驶VLA、大模型Agent等前沿算法的预研,并已主持和完成多项自动驾驶感知和大模型框架工具,拥有丰富的自动驾驶、大模型研发和实战经验。这门课程则聚焦在端到端自动驾驶的宏观领域,梳理一段式/两段式方向的重点算法和理论基础,详细讲解了BEV感知、大语言模型、扩散模型和强化学习。因此自动驾驶之心联合了。
2025-11-25 08:01:36
21
转载 汽车人才,扎堆逃离上海......
在上海大众、上海通用取得巨大成功后,上汽集团借助旗下两家合资企业厉兵秣马锻炼人才,从2007年开始先后推出了荣威、名爵、大通、飞凡、智己、尚界等自主品牌,吸纳了大量汽车人才。大模型、VLA、端到端、数据闭环、自动标注、BEV、Occupancy、多模态融合感知、传感器标定、3DGS、世界模型、在线地图、轨迹预测、规划控制。第三,以前薪资抠门的外省市自主品牌,能给出的薪资还不到上海车企的一半。总部不在上海,但在上海设立研发中心的有特斯拉、理想、小鹏、极氪、阿维塔、乐视、拜腾、恒大、宝能、合创、牛创……
2025-11-25 08:01:36
51
原创 浙大一篇中稿AAAI‘26的工作DiffRefiner:两阶段轨迹预测框架,创下NAVSIM新纪录!
实验结果表明,DiffRefiner达到了当前最优性能:在NAVSIM v2数据集上达到87.4的EPDMS分数,在Bench2Drive基准测试中获得87.1的驾驶分数(DS)和71.4%的成功率(SR),在两个公开基准测试中均创下新纪录。如表1所示,本文的框架实现了新的最先进性能,大幅超越了之前的最佳方法,在ResNet34骨干网络下提升了3.7%,在V2-99骨干网络下提升了1.6%。相比之下,本文的门控机制自适应地平衡了它们的贡献,实现了最佳性能,证实了自适应特征融合的优势。
2025-11-25 08:01:36
155
原创 浙大一篇中稿AAAI‘26的工作DiffRefiner:两阶段轨迹预测框架,创下NAVSIM新纪录!
实验结果表明,DiffRefiner达到了当前最优性能:在NAVSIM v2数据集上达到87.4的EPDMS分数,在Bench2Drive基准测试中获得87.1的驾驶分数(DS)和71.4%的成功率(SR),在两个公开基准测试中均创下新纪录。如表1所示,本文的框架实现了新的最先进性能,大幅超越了之前的最佳方法,在ResNet34骨干网络下提升了3.7%,在V2-99骨干网络下提升了1.6%。相比之下,本文的门控机制自适应地平衡了它们的贡献,实现了最佳性能,证实了自适应特征融合的优势。
2025-11-25 08:01:36
369
转载 端到端量产这件「小事」,做过的人才知道有多痛
由于无法保证模型直出会有100%的准确率,因此会通过一些轨迹的平滑优化算法来使得最终输出的轨迹更加的稳定和可靠,本章会介绍目前一些常用的轨迹平滑算法,既有多模态轨迹打分搜索的算法,也有轨迹平滑的算法。最后的一章重点会对量产的一些经验进行分享,会从数据、模型、场景、规则等多个视角来剖析如何使用合适的工具和手段解决相应的问题,当面临一个实际的可落地的系统时,如何更合理的选用不同的策略和方法,从而能够快速提升一个系统的能力边界。而在端到端时代,感知任务的合并,规控算法的learning化已是绝对的主流。
2025-11-24 08:01:58
10
转载 简历直推 | 驭势科技招聘规划算法工程师!
熟悉常用的路径规划方法,如混合A*、Lattice、QP、MPC等,并有相关的项目经验;研发满足复杂场景和任务要求的无人驾驶轨迹规划算法,保证无人车驾驶的安全、平顺行驶。更多自动驾驶的技术进展、行业动态、求职内推,欢迎加入自动驾驶之心知识星球!具有丰富的Linux系统下C/C++语言编程经验和良好的编程规范;规划算法工程师(工作地点:北京房山),薪资面议。学历背景优秀,或有智能驾驶相关行业大厂背景;了解车辆运动学、动力学、建模相关知识;熟知基本算法和算法优化的方法和思路;扎实的数学基础和数学建模能力;
2025-11-24 08:01:58
21
转载 研二发的论文,秋招用上了!
无论你目标是CCF-A/B/C、SCI1-4区,还是EI会议,这些 “大牛导师” 都从选题、调研、idea验证、代码、实验、润色、投稿、直至中稿一站式科研服务。A:我们有精准匹配系统:填完咨询表后,学术顾问会根据你的研究方向、目标期刊、基础水平,从300+导师中筛出3-5位最契合的,你选满意的再开始辅导。如果你现在面临导师放养,在论文写作过程中,你时常陷入选题迷茫、框架混乱、论证无力的困境,迟迟无法产出满意的论文,不妨考虑寻求专业助力,在读计算机专业硕、博,导师放养,无人指导,希望获取论文创新思路。
2025-11-24 08:01:58
25
转载 认知驱动下的小米智驾,从端到端、世界模型再到VLA......
星球内部的成员来自国内外知名高校实验室、自动驾驶相关的头部公司,其中高校和科研机构包括但不限于:上海交大、北京大学、CMU、清华大学、西湖大学、上海人工智能实验室、港科大、港大、南洋理工、新加坡国立、ETH、南京大学、华中科技大学、ETH等等!针对2025年最火的自动驾驶VLA,我们详细梳理了最新的综述、VLA开源数据集、作为语言解释器的相关算法、模块化VLA、端到端VLA和推理增强VLA,更有诸多关于VLA量产的讨论,在这里有你想知道的一切~目前星友面对面已经开展到了第四期,我们聊技术、聊趋势、聊变化。
2025-11-24 08:01:58
64
转载 大模型技术学习过程梳理:Agent、RAG、通用大模型等......
星球内部的嘉宾正在快速扩张中,我们邀请了来自国内外知名高校实验室、大模型/互联网相关的头部公司,其中高校和科研机构包括但不限于:上交、清华、北京大学、上海人工智能实验室、港科大、港大等等!为了构建一个专业的交流社区,我们目前已经邀请到了40+学术界和工业界的大佬,他们来自国内外知名高校实验室、大模型/互联网相关的头部公司,其中高校和科研机构包括但不限于:上交、清华、北京大学、上海人工智能实验室、港科大、港大等等!但还有相当多的同学卡住了,比如算力的问题,自建数据集的问题,还有模型优化、项目实战的问题等。
2025-11-23 10:02:43
44
转载 做了一份3DGS的学习路线图,面向初学者
整体上第二章的设计思路是带大家先打好基础,先详细梳理3DGS的原理部分及核心伪代码,接着讲解动态重建、表面重建、鱼眼重建和光线追踪的经典文章和最新的算法,由点及面层层深入。作为一个新兴的技术栈,3DGS目前已经在自动驾驶、医疗、虚拟现实和游戏等领域获得了很广泛的应用,目前主流的方向可以分为2DGS/3DGS/4DGS和前馈GS。课程将详细的讲解3DGS的算法原理,细粒度的拆分主流的技术方向,深入探索在自动驾驶中的应用及重要的研究方向,并配备Project进行实践。
2025-11-22 10:01:13
74
转载 宇树这次堵死了骗融资的路
就比如我是个人开发者,我现在买台G1-D回家,就自己在家通过遥控采集数据,采集完了以后,宇树居然还提供现成的模型还有训练平台!现在随着π0.5、gen0出来,你会发现大家早就不满足看叠衣服了,要看你连续规划的能力,看你自主对话并做出肢体反馈的能力。市场上有不少二道贩子,专门买了G1来做租赁,做跳舞表演,各大商场巡回演出,主要是满足用户的好奇心。放在25年底,你拿个叠衣服的VLA demo出来,根本拿不出手,更不用说,现在门槛降低0的情况了。到了25年底,跟着小姐姐学跳舞和连续后空翻,大家都觉得理所应当了。
2025-11-22 10:01:13
70
转载 基于Qwen3-VL的自动驾驶场景实测
这让我们有理由相信:未来,基于通用大模型的自动驾驶系统,或许不再需要海量场景数据的反复打磨,而是通过“常识推理+多模态理解”的方式,实现更高效、更泛化、更可信的驾驶决策。它不仅能“看到”图像中的内容,更能“理解”场景背后的逻辑与风险,甚至在未经过专门训练的情况下,展现出接近人类驾驶员的常识判断与安全意识。,却能对复杂交通场景做出合理、连贯、甚至带有“安全意识”的判断——这让我们看到了通用视觉语言模型在垂直领域中落地的更多可能。基准中的部分图像,以及基准中的一些中翻后的问题。👨🎓:图中的交通标志是什么?
2025-11-22 10:01:13
114
转载 NeurIPS‘25 | 博世最新D2GS:无需LiDAR的自驾场景重建方案
近年来,3DGS在自动驾驶领域的城市场景重建中展现出巨大潜力。然而,当前的城市场景重建方法通常依赖于多模态传感器输入,例如激光雷达和图像。i)需要对激光雷达与其他传感器之间进行精确的时空标定,因为它们可能并非同时捕获数据;ii)当激光雷达和相机安装在不同位置时,空间未对准会导致重投影误差。为了避免获取精确激光雷达深度的困难,本文提出了 D²GS,在这项工作中,获得了与激光雷达效果相当,但更密集、更精确的几何先验。🚀 直播精华看不够?一种无需激光雷达的城市场景重建框架。>>直播和内容获取转到 →。
2025-11-21 08:02:06
转载 NeurIPS‘25 | 博世最新D2GS:无需LiDAR的自驾场景重建方案
近年来,3DGS在自动驾驶领域的城市场景重建中展现出巨大潜力。然而,当前的城市场景重建方法通常依赖于多模态传感器输入,例如激光雷达和图像。i)需要对激光雷达与其他传感器之间进行精确的时空标定,因为它们可能并非同时捕获数据;ii)当激光雷达和相机安装在不同位置时,空间未对准会导致重投影误差。为了避免获取精确激光雷达深度的困难,本文提出了 D²GS,在这项工作中,获得了与激光雷达效果相当,但更密集、更精确的几何先验。🚀 直播精华看不够?一种无需激光雷达的城市场景重建框架。>>直播和内容获取转到 →。
2025-11-21 08:02:06
6
转载 NeurIPS‘25 | 博世最新D2GS:无需LiDAR的自驾场景重建方案
近年来,3DGS在自动驾驶领域的城市场景重建中展现出巨大潜力。然而,当前的城市场景重建方法通常依赖于多模态传感器输入,例如激光雷达和图像。i)需要对激光雷达与其他传感器之间进行精确的时空标定,因为它们可能并非同时捕获数据;ii)当激光雷达和相机安装在不同位置时,空间未对准会导致重投影误差。为了避免获取精确激光雷达深度的困难,本文提出了 D²GS,在这项工作中,获得了与激光雷达效果相当,但更密集、更精确的几何先验。🚀 直播精华看不够?一种无需激光雷达的城市场景重建框架。>>直播和内容获取转到 →。
2025-11-21 08:02:06
6
转载 NeurIPS‘25 | 博世最新D2GS:无需LiDAR的自驾场景重建方案
近年来,3DGS在自动驾驶领域的城市场景重建中展现出巨大潜力。然而,当前的城市场景重建方法通常依赖于多模态传感器输入,例如激光雷达和图像。i)需要对激光雷达与其他传感器之间进行精确的时空标定,因为它们可能并非同时捕获数据;ii)当激光雷达和相机安装在不同位置时,空间未对准会导致重投影误差。为了避免获取精确激光雷达深度的困难,本文提出了 D²GS,在这项工作中,获得了与激光雷达效果相当,但更密集、更精确的几何先验。🚀 直播精华看不够?一种无需激光雷达的城市场景重建框架。>>直播和内容获取转到 →。
2025-11-21 08:02:06
18
转载 一边是自驾就业哀鸿遍野,一边是公司招不到人......
无论你目标是CCF-A/B/C、SCI1-4区,还是EI会议,这些 “大牛导师” 都从选题、调研、idea验证、代码、实验、润色、投稿、直至中稿一站式科研服务。A:我们有精准匹配系统:填完咨询表后,学术顾问会根据你的研究方向、目标期刊、基础水平,从300+导师中筛出3-5位最契合的,你选满意的再开始辅导。大家普遍挺焦虑的,行情确实不好,应届生找工作难,能拿到一个差强人意的offer就不错了。A:不同的分区价格不同,我们会根据你的情况给你做详细的介绍,以及如何帮助你达到你的目标。
2025-11-21 08:02:06
27
转载 NeurIPS‘25 | 博世最新D2GS:无需LiDAR的自驾场景重建方案
近年来,3DGS在自动驾驶领域的城市场景重建中展现出巨大潜力。然而,当前的城市场景重建方法通常依赖于多模态传感器输入,例如激光雷达和图像。i)需要对激光雷达与其他传感器之间进行精确的时空标定,因为它们可能并非同时捕获数据;ii)当激光雷达和相机安装在不同位置时,空间未对准会导致重投影误差。为了避免获取精确激光雷达深度的困难,本文提出了 D²GS,在这项工作中,获得了与激光雷达效果相当,但更密集、更精确的几何先验。🚀 直播精华看不够?一种无需激光雷达的城市场景重建框架。>>直播和内容获取转到 →。
2025-11-21 08:02:06
38
转载 驭势科技 | 规划算法工程师招聘(可直推)
熟悉常用的路径规划方法,如混合A*、Lattice、QP、MPC等,并有相关的项目经验;研发满足复杂场景和任务要求的无人驾驶轨迹规划算法,保证无人车驾驶的安全、平顺行驶。更多自动驾驶的技术进展、行业动态、求职内推,欢迎加入自动驾驶之心知识星球!具有丰富的Linux系统下C/C++语言编程经验和良好的编程规范;规划算法工程师(工作地点:北京房山),薪资面议。学历背景优秀,或有智能驾驶相关行业大厂背景;了解车辆运动学、动力学、建模相关知识;熟知基本算法和算法优化的方法和思路;扎实的数学基础和数学建模能力;
2025-11-21 08:02:06
48
转载 工业界算法专家带队!面向落地的端到端自动驾驶小班课
由于无法保证模型直出会有100%的准确率,因此会通过一些轨迹的平滑优化算法来使得最终输出的轨迹更加的稳定和可靠,本章会介绍目前一些常用的轨迹平滑算法,既有多模态轨迹打分搜索的算法,也有轨迹平滑的算法。最后的一章重点会对量产的一些经验进行分享,会从数据、模型、场景、规则等多个视角来剖析如何使用合适的工具和手段解决相应的问题,当面临一个实际的可落地的系统时,如何更合理的选用不同的策略和方法,从而能够快速提升一个系统的能力边界。而在端到端时代,感知任务的合并,规控算法的learning化已是绝对的主流。
2025-11-21 08:02:06
68
转载 自动驾驶三大技术路线:端到端、VLA、世界模型
除了两个模块之间的输出从 基于人类可理解的抽象输出变为特征向量,在训练方式上,这个阶段的模型必须支持跨模块的梯度传导 —— 两个模块均无法独立进行训练,训练必须通过梯度传导的方式同时进行。多模态信息的统一表征:语言作为通用语义载体,实现了视觉、语音、导航等异构信息的端到端对齐,解决了传统架构的接口瓶颈问题。决策和规划模块:根据导航信息,并在接受上游的感知和定位信息的基础上,同时结合自车的当前状态,对当前环境进行分析并做出具体决策,以在有限的时间范围内规划出满足安全、舒适等约束条件的可行驶轨迹。
2025-11-21 08:02:06
242
原创 理想一篇中稿AAAI‘26的LiDAR生成工作 - DriveLiDAR4D
为缓解这一问题,我们提出先合成物体的点云,再将其作为条件引导模型生成完整场景。此外,值得注意的是,DriveLiDAR4D能够生成保持时序一致性的激光雷达场景序列,而RangeLDM和Text2LiDAR仅能生成孤立的单个激光雷达场景。我们在nuScenes和KITTI数据集上对DriveLiDAR4D进行了评估,在nuScenes数据集上实现了743.13的FRD分数和16.96的FVD分数,超越了当前最先进方法UniScene,FRD性能提升37.2%,FVD性能提升24.1%。
2025-11-20 08:03:58
108
转载 和港校自驾博士交流后的一些分享......
星球内部的成员来自国内外知名高校实验室、自动驾驶相关的头部公司,其中高校和科研机构包括但不限于:上海交大、北京大学、CMU、清华大学、西湖大学、上海人工智能实验室、港科大、港大、南洋理工、新加坡国立、ETH、南京大学、华中科技大学、ETH等等!关于申博的一些建议:对研三还未申到博士的同学,可以多联系高校老师做RA,不一定要完全匹配老师的方向,自己带着方向找老师也是一种优势,有的老师可能已经想开自驾方向的博士了,但精力上抽不开身,自驾和具身作为现在现在很火的方向,很多老师都不排除。自动驾驶VLA的学习路线。
2025-11-20 08:03:58
48
转载 跨越“仿真到实车”的鸿沟:如何构建端到端高置信度验证体系?
在受控光照环境(如光学暗室)和真实户外场景中,分别放置标准棋盘格、Macbeth色卡,或在可复现的真实环境中(如测试场的高速路段)设计特定场景(如空旷道路巡航、前车跟随),在仿真环境中精确复现该场景(包括车辆轨迹、道路几何与材质)。例如,仿真场景中的车速分布、车头时距分布、车型比例等,如果与特定道路(如城市快速路)在特定时段(如晚高峰)的真实数据存在显著差异,那么在该场景下进行的测试将失去统计学意义[6]。通过对比真实传感器采集的深度数据与仿真渲染的深度图,可以精确评估场景的几何误差(MAE/RMSE)。
2025-11-20 08:03:58
94
原创 理想一篇中稿AAAI‘26的LiDAR生成工作 - DriveLiDAR4D
为缓解这一问题,我们提出先合成物体的点云,再将其作为条件引导模型生成完整场景。此外,值得注意的是,DriveLiDAR4D能够生成保持时序一致性的激光雷达场景序列,而RangeLDM和Text2LiDAR仅能生成孤立的单个激光雷达场景。我们在nuScenes和KITTI数据集上对DriveLiDAR4D进行了评估,在nuScenes数据集上实现了743.13的FRD分数和16.96的FVD分数,超越了当前最先进方法UniScene,FRD性能提升37.2%,FVD性能提升24.1%。
2025-11-20 08:03:58
179
原创 理想一篇中稿AAAI‘26的LiDAR生成工作 - DriveLiDAR4D
为缓解这一问题,我们提出先合成物体的点云,再将其作为条件引导模型生成完整场景。此外,值得注意的是,DriveLiDAR4D能够生成保持时序一致性的激光雷达场景序列,而RangeLDM和Text2LiDAR仅能生成孤立的单个激光雷达场景。我们在nuScenes和KITTI数据集上对DriveLiDAR4D进行了评估,在nuScenes数据集上实现了743.13的FRD分数和16.96的FVD分数,超越了当前最先进方法UniScene,FRD性能提升37.2%,FVD性能提升24.1%。
2025-11-20 08:03:58
400
原创 理想一篇中稿AAAI‘26的LiDAR生成工作 - DriveLiDAR4D
为缓解这一问题,我们提出先合成物体的点云,再将其作为条件引导模型生成完整场景。此外,值得注意的是,DriveLiDAR4D能够生成保持时序一致性的激光雷达场景序列,而RangeLDM和Text2LiDAR仅能生成孤立的单个激光雷达场景。我们在nuScenes和KITTI数据集上对DriveLiDAR4D进行了评估,在nuScenes数据集上实现了743.13的FRD分数和16.96的FVD分数,超越了当前最先进方法UniScene,FRD性能提升37.2%,FVD性能提升24.1%。
2025-11-20 08:03:58
578
原创 理想一篇中稿AAAI‘26的LiDAR生成工作 - DriveLiDAR4D
为缓解这一问题,我们提出先合成物体的点云,再将其作为条件引导模型生成完整场景。此外,值得注意的是,DriveLiDAR4D能够生成保持时序一致性的激光雷达场景序列,而RangeLDM和Text2LiDAR仅能生成孤立的单个激光雷达场景。我们在nuScenes和KITTI数据集上对DriveLiDAR4D进行了评估,在nuScenes数据集上实现了743.13的FRD分数和16.96的FVD分数,超越了当前最先进方法UniScene,FRD性能提升37.2%,FVD性能提升24.1%。
2025-11-20 08:03:58
706
原创 理想一篇中稿AAAI‘26的LiDAR生成工作 - DriveLiDAR4D
为缓解这一问题,我们提出先合成物体的点云,再将其作为条件引导模型生成完整场景。此外,值得注意的是,DriveLiDAR4D能够生成保持时序一致性的激光雷达场景序列,而RangeLDM和Text2LiDAR仅能生成孤立的单个激光雷达场景。我们在nuScenes和KITTI数据集上对DriveLiDAR4D进行了评估,在nuScenes数据集上实现了743.13的FRD分数和16.96的FVD分数,超越了当前最先进方法UniScene,FRD性能提升37.2%,FVD性能提升24.1%。
2025-11-20 08:03:58
841
原创 理想一篇中稿AAAI‘26的LiDAR生成工作 - DriveLiDAR4D
为缓解这一问题,我们提出先合成物体的点云,再将其作为条件引导模型生成完整场景。此外,值得注意的是,DriveLiDAR4D能够生成保持时序一致性的激光雷达场景序列,而RangeLDM和Text2LiDAR仅能生成孤立的单个激光雷达场景。我们在nuScenes和KITTI数据集上对DriveLiDAR4D进行了评估,在nuScenes数据集上实现了743.13的FRD分数和16.96的FVD分数,超越了当前最先进方法UniScene,FRD性能提升37.2%,FVD性能提升24.1%。
2025-11-20 08:03:58
934
原创 理想一篇中稿AAAI‘26的LiDAR生成工作 - DriveLiDAR4D
为缓解这一问题,我们提出先合成物体的点云,再将其作为条件引导模型生成完整场景。此外,值得注意的是,DriveLiDAR4D能够生成保持时序一致性的激光雷达场景序列,而RangeLDM和Text2LiDAR仅能生成孤立的单个激光雷达场景。我们在nuScenes和KITTI数据集上对DriveLiDAR4D进行了评估,在nuScenes数据集上实现了743.13的FRD分数和16.96的FVD分数,超越了当前最先进方法UniScene,FRD性能提升37.2%,FVD性能提升24.1%。
2025-11-20 08:03:58
951
转载 Physical Intelligence团队正式发布π*0.6
这意味着不仅要利用示范数据,更需要整合自主收集的实践数据,使策略能够修正实际部署中出现的错误,在人类远程操作水平之上提升执行速度与鲁棒性,并适应新的部署环境。虽然基于强化学习的自主实践理论基础早在数十年前就已确立,但要将这些原理融入通用且可扩展的机器人学习系统仍面临重大挑战:为大型模型设计可扩展且稳定的强化学习方法、处理来自不同策略的异构数据,以及在奖励信号可能模糊或随机的现实环境中建立具备奖励反馈的强化学习训练机制。通过该奖励函数,训练价值函数预测成功片段的(负的)剩余成功步数,以及失败片段的大负值。
2025-11-19 08:01:22
66
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅