- 博客(6152)
- 资源 (35)
- 收藏
- 关注
转载 SLAM与3DGS学习路线有啥不同?
如果是想走GS SLAM的话,我建议可以选一个比较经典的开源框架(比如SplaTAM、MonoGS),先不用着急吃透代码和原理,先把它在公开数据集上跑起来(比如Replica、TUM),运行起来通过GUI你就能理解3D GS到底是个什么东西,运行起来到底是什么样子,然后你可以带着问题“比如它到底是怎么优化的pose,新的高斯点具体是如何生成,具体是如何做的BA”去查文献和代码。通过这个过程你也能看出来这个框架存在哪些问题,解决这些问题,你的创新点和工作量就有了。「3D视觉从入门到精通」星友提问。
2025-12-14 00:01:58
2
转载 NeurlPS‘25开源 | 中科院新作AutoSeg3D:在线分割一切3D物体,超越ESAM!
通过集成这些模块,我们的框架在保持实时吞吐量的同时,在 ScanNet200上相比近期的 ESAM实现了 2.8 AP 的提升。与此类似,我们将框架分解为用于实例关联的长期记忆和用于实例更新的短期记忆,由三个轻量级但协同的模块实现:1)长期记忆(LTM),可在长时间内匹配实例标识,实现长时间遮挡后的恢复。3)空间一致性学习(SCL)包括推理时的基于学习的掩码集成和训练时的实例一致性掩码监督,分别抵消 VFM 固有的过度分割问题,从而减少查询冗余,并为 STM 和 LTM 提供连贯、高保真的掩码表示。
2025-12-11 07:02:05
37
转载 霸气碾压纯传感器方案!复旦&上交新作:解锁自动驾驶5大任务,极端场景性能飙升16.6%,即插即用!
针对地理图像可能存在的缺失、错位问题,研究还引入了可靠性估计门,通过计算检索位置与车辆位置的GPS距离、车载图像与地理图像的特征相似度,生成0-1区间的可靠性分数,动态调整地理特征的融合权重,避免不可靠数据影响模型性能。现有自动驾驶系统依赖车载传感器,在遮挡、恶劣天气等复杂场景易失效,本文提出的空间检索范式,通过引入离线地理图像作为额外输入,搭配通用适配模块和可靠性估计机制,显著提升了五大核心自动驾驶任务的性能,为系统赋予类似人类驾驶员的“道路记忆”能力。本文仅做学术分享,如有侵权,请联系删文。
2025-12-11 07:02:05
35
转载 地平线苏箐演讲全文提炼:自动驾驶的曙光、痛苦与轮回
因为感知技术也是发展了很多年,才被数据驱动完全搞定的,而规控的理论(至今)都还是不成熟的,且每尝试一轮都需要数亿元,还有可能无果,这对于精神还是资金都是考验:当时的系统是非常不收敛的,任何一个噪声都会导致整个系统废掉,所以这件事情非常困难。这就是新的方法论和数据驱动的魅力,它从人类的稠密数据里面,会学到一切能力,无论是好的还是坏的,但是我们需要把坏的处理,这就是跟过去不一样的地方。的车以同样的价格,在用户无感的情况下送到你的手上,这是我们希望行业能做到的一个目标,虽然很难,但这是我们所有人辛苦了这。
2025-12-10 07:03:12
36
转载 小白如何一个月内彻底搞透结构光三维重建?
我们推出了「精迅」系列设备,是一台面向科研级的高速、高精度、源码级开发的3d面结构光测量设备,能够自由DIY配置,并且与机械臂等结合,开发相应的应用。算法经过高度优化,适配高分辨率相机。:采用DLP4710光机,分辨率更高,支持彩色条纹写入,最高亮度1000LM,无惧户外和黑色场景,适合大范围场景重建。:采用DLP3010光机,界面经过高度优化,一键重建、点云滤波、显示,适合手在眼上的视觉引导、测量场景。点云处理:可以手动设置滤波参数,自动化处理点云,并且可以与点云进行交互、裁切、表面重建算法,
2025-12-10 07:03:12
38
转载 FAST-LIO系列一作重磅分享 | 多传感器融合SLAM的过去、现在与将来!
点击下方卡片,关注「3D视觉工坊」公众号选择星标,干货第一时间送达3D视觉工坊很荣幸邀请到了留形科技首席技术官徐威博士,为大家着重分享相关领域的核心内容。如果您有相关内容需要分享,欢迎文末联系我们。时间2025年12月11日(周四)19:00主题多传感器融合SLAM的过去、现在与将来直播平台3D视觉工坊视频号点击按钮预约直播3D视觉工坊哔哩哔哩也将同步直播徐威留形科技首席技术官留形科技首席技术官,2022年8月香港大学博士毕业,师从张富教授和James Lam教授,长期专注于多传感器融合、机器人感知规划控制
2025-12-10 07:03:12
40
转载 重磅发布 | 视比特 SpeedWeld 智能焊接控制软件:让机器人焊接更高效
配置了可视化层道编辑器,在焊接启动前,工艺工程师可根据现场情况单独调整每一道的参数,如轨迹和姿态偏移量、头尾收缩量等;搭配软件内置的多层多道调试工具,可灵活便捷地调整每一层道的焊接轨迹和参数,将原本耗时数小时的手动排道工作,缩短至几十分钟内完成。,包括扫描姿态、焊枪角度和焊接工艺等。等前沿技术,大幅提升智能焊接效率与精度,为工程机械、船舶、汽车、新能源装备等领域的焊接生产,注入智能化新动力。软件中的焊接动作(定位、寻位、焊接等)以图形化节点呈现,拖拽节点即可调整流程顺序,双击节点便能编辑参数。
2025-12-09 07:01:49
40
转载 ROBOVIS‘26 关键帧智能筛选,混合误差&动量感知,复杂环境重建完整性超传统方法 28%!
该方法集成了基于误差的选择模块和基于动量的更新模块,前者利用光度和结构相似性(SSIM)误差,后者根据场景运动动态动态调整关键帧选择阈值。:对Bonn数据集进行逐场景分析,关键帧压缩比(KFCR)图显示该方法的选择率会根据场景复杂度动态变化,在简单场景中使用更少的帧(更高的KFCR),在复杂场景中使用更多的帧(更低的KFCR)。在具有挑战性的真实世界Bonn数据集上,该方法在所有重建指标上均取得了更优结果,同时使用的关键帧更少(更高的关键帧压缩比),既提高了效率,又使最终重建更加准确和完整。
2025-12-08 07:02:44
37
转载 刚刚,英伟达CUDA迎来史上最大更新!你的模型可以“一键加速”2倍!
作为 MPS 中现有的动态执行资源供给(provisioning)的一种替代方案,静态流式多处理器(SM)分区是针对 NVIDIA Ampere 架构(计算能力 8.0)及更新 GPU 的一项特性,它为 MPS 客户端提供了一种创建独占 SM 分区的方法。此次发布的 Nsight Compute 还增加了对设备端启动的图(device-launched graphs)中 CUDA 图节点的分析支持,并改进了源码页导航,为编译器生成和用户生成的标签提供了可点击的链接。
2025-12-07 00:01:45
74
转载 苏黎世大学T-RO发表HDVIO2.0,在强风和模型失配下稳住VIO
风一吹,VIO就“虚”?视觉–惯性里程(VIO)已经是微型无人机机载状态估计的标配,但在高速机动、气动效应明显、且长时间处于强风等持续外扰环境中时,仅依赖相机和IMU的传统方案往往会产生明显误差累积,定位精度快速下滑。在Blackbird中,HDVIO2.0 在多数轨迹上位置和姿态误差最低,在 Egg 8 m/s 等高速轨迹上,相比纯 VIO 和 HDVIO 误差明显降低;在NeuroBEM数据集上,只用推力/力矩 + IMU输入不同动力学模型,不跑VIO,只比较它们对力/力矩的估计精度。
2025-12-07 00:01:45
50
转载 当3D视觉技术沉淀7年会发生什么?
细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息、承接项目。3D视觉包含立体视觉、结构光和TOF,以立体视觉为主。目前已有6400+活跃成员,主要涉及方向:工业3D视觉、SLAM、自动驾驶、三维重建、无人机、具身智能、大模型等科技前沿方向。
2025-12-07 00:01:45
48
转载 破解L4自动驾驶「不可能三角」,一场关于「经验主义」的价值赛跑
在这一过程中,卡尔动力积累了400 台自动驾驶重卡车队、超过 3500 万公里的真实运营里程,以及累计 12 亿吨公里的货运量,形成了无人货运最难被复制的“经验密度”壁垒——这些 Know-How 只能在真实场景中反复校正、迭代、再校正而来。在卡尔动力的路径下,行业比拼的早已不是谁的Demo更惊艳、谁的算力更夸张,而是谁能真正让运输产业的成本结构、生产关系与运营逻辑发生实质性迁移。不堆砌不必要的算力,不叠加无效的冗余,而是以刚好解决问题的能力组合,构建出无人货运真正需要、且财务模型能够承受的系统架构。
2025-12-07 00:01:45
72
转载 上交揭秘!机器人领域中最优的3D场景表示是什么?点云?体素?SDF?Mesh?NeRF?3D GS?场景图?
我们总结了机器人领域三维场景表示的发展时间线,包括点云、体素、网格、面片(surfels)、场景图、有符号距离场(SDF),以及最近出现的神经辐射场(Neural Radiance Fields,NeRF)和三维高斯溅射(3D Gaussian Splatting,3DGS)等表示方法。我们简要介绍了不同场景表示的问题表述,随后比较了它们的差异。• 三维场景表示的未来方向:在机器人领域的每个模块中,我们指出了当前研究的技术局限性,并提出了几个有前景的未来研究方向,旨在激励这一快速发展领域的进一步进步。
2025-12-05 07:02:55
38
转载 无需 3D 重建RayPose,未见物体姿态估计新 SOTA!
传统基于模板的物体姿态估计方法在检索正确模板失败时易导致姿态预测不准确,为此作者将其重新表述为射线对齐问题,即学习使多个已姿态模板图像的观察方向与未姿态查询图像对齐,并将该问题嵌入到扩散变压器架构中。实验在标准基准数据集上进行,采用平均召回率作为评估指标,结果表明该方法在未见物体姿态估计任务中优于现有方法,消融实验验证了相对姿态预测、多视图预测、模板真实姿态等关键组件的有效性,还评估了模板姿态分布对方法性能的影响,强调了为粗、细预测器选择合适模板分布的重要性。模板编码器对多个有姿态模板信息进行编码和融合;
2025-12-04 07:04:21
41
转载 Nullmax 徐雷:视觉能力将决定智驾系统上限,反对把激光雷达当 “拐棍”
我们认为,用激光雷达像拐棍或捷径,能让智驾系统快速实现量产上车,但最终要达到一定高度,还是要把视觉 AI 能力做好,这没那么急功近利。开车需要在电光石火间作出决策,如果输入帧率和信息量跟不上,虽然车也能行驶,但在需要快速反应的场景下,智驾方案的能力确实会差一些。第二,对于车上的传感器,无论是激光雷达、4D 毫米波雷达还是将来的新东西,我都持开放态度,我不认为车上只能有摄像头。如果有这些传感器当然更好,但从马斯克的角度,摄像头就能达到要求:晚上有灯光,现在的 CMOS 传感器进光量大,也能看到很多东西。
2025-12-04 07:04:21
43
转载 NeurIPS‘25 | 端到端驾驶新基准!VR-Drive 新视图合成技术,路线完成率突破 92%,碾压 5 大 SOTA!
在这项工作中,我们提出了VR-Drive,这是一种新颖的端到端自动驾驶框架,它通过将三维场景重建作为辅助任务进行联合学习,以实现规划感知的视图合成,从而解决视角泛化问题。此外,我们发布了一个新的基准数据集,用于评估在新相机视角下端到端自动驾驶的性能,从而实现全面分析。基于原始3DGS框架,用高斯基元表示场景,通过前馈方式直接从输入图像预测基元,联合学习深度作为E2E-AD框架的一部分,用预测的深度图和图像特征图输入到高斯网络预测高斯基元的其余参数,前馈设计支持对新颖视图的在线推理和对新输入的泛化。
2025-12-02 07:02:37
53
转载 出圈!硕士论文一夜被下载两万次,不少人读了之后表示破防!
翻开论文背景,《乌有之猫:云吸猫迷群的认同与幻想》的作者是浙江大学的硕士,《中国传统文化对蟋蟀身体与战斗力关系的认识》的作者是中国科学院大学的讲师,《行长的面部宽高比影响银行绩效的路径研究》的第一作者是南开大学的教授。学术的生命力源于多元,导生关系、网络文化等贴近现实的议题,恰能有效填补传统研究的空白。该研究通过对导师制中导师关系的起点、导生互动、导师制的评价及导师制保障因素的分析,发现导生匹配上的责权不一、导生互动中教育性和学术性的淡化以及导师评价的缺失、学生评价的失声是换导师事件值得反思的几个问题。
2025-12-02 07:02:37
60
转载 NeurIPS‘25 | 端到端驾驶新基准!VR-Drive 新视图合成技术,路线完成率突破 92%,碾压 5 大 SOTA!
在这项工作中,我们提出了VR-Drive,这是一种新颖的端到端自动驾驶框架,它通过将三维场景重建作为辅助任务进行联合学习,以实现规划感知的视图合成,从而解决视角泛化问题。此外,我们发布了一个新的基准数据集,用于评估在新相机视角下端到端自动驾驶的性能,从而实现全面分析。基于原始3DGS框架,用高斯基元表示场景,通过前馈方式直接从输入图像预测基元,联合学习深度作为E2E-AD框架的一部分,用预测的深度图和图像特征图输入到高斯网络预测高斯基元的其余参数,前馈设计支持对新颖视图的在线推理和对新输入的泛化。
2025-12-02 07:02:37
21
转载 NeurIPS‘25 | 端到端驾驶新基准!VR-Drive 新视图合成技术,路线完成率突破 92%,碾压 5 大 SOTA!
在这项工作中,我们提出了VR-Drive,这是一种新颖的端到端自动驾驶框架,它通过将三维场景重建作为辅助任务进行联合学习,以实现规划感知的视图合成,从而解决视角泛化问题。此外,我们发布了一个新的基准数据集,用于评估在新相机视角下端到端自动驾驶的性能,从而实现全面分析。基于原始3DGS框架,用高斯基元表示场景,通过前馈方式直接从输入图像预测基元,联合学习深度作为E2E-AD框架的一部分,用预测的深度图和图像特征图输入到高斯网络预测高斯基元的其余参数,前馈设计支持对新颖视图的在线推理和对新输入的泛化。
2025-12-02 07:02:37
24
转载 NeurIPS‘25 | 端到端驾驶新基准!VR-Drive 新视图合成技术,路线完成率突破 92%,碾压 5 大 SOTA!
在这项工作中,我们提出了VR-Drive,这是一种新颖的端到端自动驾驶框架,它通过将三维场景重建作为辅助任务进行联合学习,以实现规划感知的视图合成,从而解决视角泛化问题。此外,我们发布了一个新的基准数据集,用于评估在新相机视角下端到端自动驾驶的性能,从而实现全面分析。基于原始3DGS框架,用高斯基元表示场景,通过前馈方式直接从输入图像预测基元,联合学习深度作为E2E-AD框架的一部分,用预测的深度图和图像特征图输入到高斯网络预测高斯基元的其余参数,前馈设计支持对新颖视图的在线推理和对新输入的泛化。
2025-12-02 07:02:37
31
转载 NeurIPS‘25 | 端到端驾驶新基准!VR-Drive 新视图合成技术,路线完成率突破 92%,碾压 5 大 SOTA!
在这项工作中,我们提出了VR-Drive,这是一种新颖的端到端自动驾驶框架,它通过将三维场景重建作为辅助任务进行联合学习,以实现规划感知的视图合成,从而解决视角泛化问题。此外,我们发布了一个新的基准数据集,用于评估在新相机视角下端到端自动驾驶的性能,从而实现全面分析。基于原始3DGS框架,用高斯基元表示场景,通过前馈方式直接从输入图像预测基元,联合学习深度作为E2E-AD框架的一部分,用预测的深度图和图像特征图输入到高斯网络预测高斯基元的其余参数,前馈设计支持对新颖视图的在线推理和对新输入的泛化。
2025-12-02 07:02:37
22
转载 NeurIPS‘25 | 端到端驾驶新基准!VR-Drive 新视图合成技术,路线完成率突破 92%,碾压 5 大 SOTA!
在这项工作中,我们提出了VR-Drive,这是一种新颖的端到端自动驾驶框架,它通过将三维场景重建作为辅助任务进行联合学习,以实现规划感知的视图合成,从而解决视角泛化问题。此外,我们发布了一个新的基准数据集,用于评估在新相机视角下端到端自动驾驶的性能,从而实现全面分析。基于原始3DGS框架,用高斯基元表示场景,通过前馈方式直接从输入图像预测基元,联合学习深度作为E2E-AD框架的一部分,用预测的深度图和图像特征图输入到高斯网络预测高斯基元的其余参数,前馈设计支持对新颖视图的在线推理和对新输入的泛化。
2025-12-02 07:02:37
22
转载 自动驾驶最新技术路线总结(分阶段、BEV、端到端、VLA)
点击下方卡片,关注「3D视觉工坊」公众号选择星标,干货第一时间送达来源:深蓝AI「3D视觉从入门到精通」知识星球(点开有惊喜) !星球内新增20多门3D视觉系统课程、入门环境配置教程、多场顶会直播、顶会论文最新解读、3D视觉算法源码、求职招聘等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!行业在解决的问题:安全且经济 corner case技术路线之争 单车智能 vs 智能网联传感器:视觉 vs 激光雷达算法架构:模块化 vs 端到端AI决策:VLM vs VLA vs WA(去LLM)Waymo等主流
2025-12-01 07:02:17
279
转载 比FastVGGT更快更强!博世新作HTTM:7倍加速VGGT,三维重建精度无损,无需训练!
在本研究中,我们提出了HTTM,这是一种无需训练的标记合并方法,可加速VGGT的推理。为了利用VGGT在头部嵌入层面的标记的空间局部性和时间对应性,我们引入了一种时间重排序和头部级自适应异常值过滤技术,该技术帮助HTTM高效合并标记,同时保留其独特性,从而在长输入序列上实现高达7倍的显著加速,且性能无下降。• 针对现有标记合并方法的主要计算开销,我们分析了合并成本与合并质量之间的权衡,并提出了一种结合时间重排序的块级合并策略,该策略通过对齐空间和时间相关标记,在保持合并质量的同时大幅降低了合并成本。
2025-12-01 07:02:17
57
转载 暴虐VGGT!伦敦大学学院开源AMB3R:姿态估计、深度估计、3D重建、真实尺度计算全部SOTA!
对于稠密三维重建,从传统方法(例如,KinectFusion)到现代神经隐式模型(例如,DeepSDF、NeRF、NeuralRecon )的方法,都采用紧凑的三维表示形式,如截断符号距离函数(Truncated Signed Distance Function, TSDF)网格、特征网格或基于坐标的网络。在13个数据集的7项任务上取得了最先进的性能,超越了现有的三维基础模型,并且仅需学术级训练资源(约80个H100 GPU小时)在冻结的VGGT [124]权重基础上训练度量尺度头和新的后端。
2025-11-30 00:01:55
69
转载 NeurIPS‘25 | 3D 高斯 splatting 升级!PlanarGS 单小时训练,新视角合成 PSNR 超 38dB
我们提出了一种名为PlanarGS的新方法,将平面和多视图深度先验融入3D高斯 splatting(3DGS)中,解决了室内场景中常见的大尺寸无纹理平面重建不准确的问题。:用VGGT替代多视图基础模型,用YoloWorld和SAM替代视觉语言基础模型,并在Replica数据集上增加提示词,对重建结果影响极小,表明PlanarGS的语言提示平面先验(LP3)管道和先验监督具有鲁棒性,基础模型的改进可能进一步提升其性能。我们的平面先验仅对检测到的平面区域有效,在以大尺寸平面为主的室内环境中效果良好。
2025-11-29 00:02:59
47
转载 NeurIPS‘25 | 3D 高斯 splatting 升级!PlanarGS 单小时训练,新视角合成 PSNR 超 38dB
我们提出了一种名为PlanarGS的新方法,将平面和多视图深度先验融入3D高斯 splatting(3DGS)中,解决了室内场景中常见的大尺寸无纹理平面重建不准确的问题。:用VGGT替代多视图基础模型,用YoloWorld和SAM替代视觉语言基础模型,并在Replica数据集上增加提示词,对重建结果影响极小,表明PlanarGS的语言提示平面先验(LP3)管道和先验监督具有鲁棒性,基础模型的改进可能进一步提升其性能。我们的平面先验仅对检测到的平面区域有效,在以大尺寸平面为主的室内环境中效果良好。
2025-11-29 00:02:59
27
转载 NeurIPS‘25 | 3D 高斯 splatting 升级!PlanarGS 单小时训练,新视角合成 PSNR 超 38dB
我们提出了一种名为PlanarGS的新方法,将平面和多视图深度先验融入3D高斯 splatting(3DGS)中,解决了室内场景中常见的大尺寸无纹理平面重建不准确的问题。:用VGGT替代多视图基础模型,用YoloWorld和SAM替代视觉语言基础模型,并在Replica数据集上增加提示词,对重建结果影响极小,表明PlanarGS的语言提示平面先验(LP3)管道和先验监督具有鲁棒性,基础模型的改进可能进一步提升其性能。我们的平面先验仅对检测到的平面区域有效,在以大尺寸平面为主的室内环境中效果良好。
2025-11-29 00:02:59
28
转载 NeurIPS‘25 | 3D 高斯 splatting 升级!PlanarGS 单小时训练,新视角合成 PSNR 超 38dB
我们提出了一种名为PlanarGS的新方法,将平面和多视图深度先验融入3D高斯 splatting(3DGS)中,解决了室内场景中常见的大尺寸无纹理平面重建不准确的问题。:用VGGT替代多视图基础模型,用YoloWorld和SAM替代视觉语言基础模型,并在Replica数据集上增加提示词,对重建结果影响极小,表明PlanarGS的语言提示平面先验(LP3)管道和先验监督具有鲁棒性,基础模型的改进可能进一步提升其性能。我们的平面先验仅对检测到的平面区域有效,在以大尺寸平面为主的室内环境中效果良好。
2025-11-29 00:02:59
30
转载 NeurIPS‘25 | 3D 高斯 splatting 升级!PlanarGS 单小时训练,新视角合成 PSNR 超 38dB
我们提出了一种名为PlanarGS的新方法,将平面和多视图深度先验融入3D高斯 splatting(3DGS)中,解决了室内场景中常见的大尺寸无纹理平面重建不准确的问题。:用VGGT替代多视图基础模型,用YoloWorld和SAM替代视觉语言基础模型,并在Replica数据集上增加提示词,对重建结果影响极小,表明PlanarGS的语言提示平面先验(LP3)管道和先验监督具有鲁棒性,基础模型的改进可能进一步提升其性能。我们的平面先验仅对检测到的平面区域有效,在以大尺寸平面为主的室内环境中效果良好。
2025-11-29 00:02:59
17
转载 NeurIPS‘25 微软开源SOTA | MoGe-2:一张图重建尺度点云
现就读于中国科学技术大学,微软亚洲研究院联合培养四年级博士生。主要研究方向包括3D视觉感知,几何估计,3D资产生成。博士期间参与多个广受好评开源项目,包括单目几何估计 MoGe 系列、3D 资产生成 Trellis 系列,在 Github 分别收获千星、万星。:3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。,为大家着重分享他们团队的工作。,为大家着重分享他们团队的工作。3D视觉工坊哔哩哔哩。
2025-11-25 07:03:25
73
转载 NeurIPS‘25 微软开源SOTA | MoGe-2:一张图重建尺度点云
现就读于中国科学技术大学,微软亚洲研究院联合培养四年级博士生。主要研究方向包括3D视觉感知,几何估计,3D资产生成。博士期间参与多个广受好评开源项目,包括单目几何估计 MoGe 系列、3D 资产生成 Trellis 系列,在 Github 分别收获千星、万星。:3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。,为大家着重分享他们团队的工作。,为大家着重分享他们团队的工作。3D视觉工坊哔哩哔哩。
2025-11-25 07:03:25
27
转载 NeurIPS‘25 微软开源SOTA | MoGe-2:一张图重建尺度点云
现就读于中国科学技术大学,微软亚洲研究院联合培养四年级博士生。主要研究方向包括3D视觉感知,几何估计,3D资产生成。博士期间参与多个广受好评开源项目,包括单目几何估计 MoGe 系列、3D 资产生成 Trellis 系列,在 Github 分别收获千星、万星。:3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。,为大家着重分享他们团队的工作。,为大家着重分享他们团队的工作。3D视觉工坊哔哩哔哩。
2025-11-25 07:03:25
26
转载 NeurIPS‘25 微软开源SOTA | MoGe-2:一张图重建尺度点云
现就读于中国科学技术大学,微软亚洲研究院联合培养四年级博士生。主要研究方向包括3D视觉感知,几何估计,3D资产生成。博士期间参与多个广受好评开源项目,包括单目几何估计 MoGe 系列、3D 资产生成 Trellis 系列,在 Github 分别收获千星、万星。:3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。,为大家着重分享他们团队的工作。,为大家着重分享他们团队的工作。3D视觉工坊哔哩哔哩。
2025-11-25 07:03:25
29
转载 NeurIPS‘25 微软开源SOTA | MoGe-2:一张图重建尺度点云
现就读于中国科学技术大学,微软亚洲研究院联合培养四年级博士生。主要研究方向包括3D视觉感知,几何估计,3D资产生成。博士期间参与多个广受好评开源项目,包括单目几何估计 MoGe 系列、3D 资产生成 Trellis 系列,在 Github 分别收获千星、万星。:3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。,为大家着重分享他们团队的工作。,为大家着重分享他们团队的工作。3D视觉工坊哔哩哔哩。
2025-11-25 07:03:25
19
转载 NeurIPS‘25 微软开源SOTA | MoGe-2:一张图重建尺度点云
现就读于中国科学技术大学,微软亚洲研究院联合培养四年级博士生。主要研究方向包括3D视觉感知,几何估计,3D资产生成。博士期间参与多个广受好评开源项目,包括单目几何估计 MoGe 系列、3D 资产生成 Trellis 系列,在 Github 分别收获千星、万星。:3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。,为大家着重分享他们团队的工作。,为大家着重分享他们团队的工作。3D视觉工坊哔哩哔哩。
2025-11-25 07:03:25
23
转载 NeurIPS‘25 微软开源SOTA | MoGe-2:一张图重建尺度点云
现就读于中国科学技术大学,微软亚洲研究院联合培养四年级博士生。主要研究方向包括3D视觉感知,几何估计,3D资产生成。博士期间参与多个广受好评开源项目,包括单目几何估计 MoGe 系列、3D 资产生成 Trellis 系列,在 Github 分别收获千星、万星。:3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。3D视觉工坊很荣幸邀请到了中国科学技术大学和微软亚洲研究院联合培养四年级博士生。,为大家着重分享他们团队的工作。,为大家着重分享他们团队的工作。3D视觉工坊哔哩哔哩。
2025-11-25 07:03:25
29
转载 RoMa v2杀疯了!更快更强的特征匹配,SLAM、三维重建、抓取、跟踪优化新思路!
受RoMa和UFM各自不同权衡的启发,在本文中,我们致力于解决将它们各自优势相结合的挑战,即开发一种稠密特征匹配器,该匹配器既对视角和外观的极端变化具有鲁棒性,又适用于广泛的现实场景,同时保持亚像素精度以及实用的运行时间和内存占用。值得注意的是,我们同时在UFM的自有基准测试TA-WB上击败了UFM,在RoMa专门训练的MegaDepth上击败了RoMa,并且在具有挑战性的AerialMegaDepth基准测试上,与RoMa相比,我们的端点误差(EPE)降低了84%。我们展示了不同基准测试结果的快照。
2025-11-24 07:02:12
137
转载 ICCV‘25 开源|RL开源方案:免训练框架让VLM提供可靠奖励
现于香港城市大学任博士后研究员,博士毕业于北京理工大学,师从刘驰教授。研究方向为真机强化学习训练,机械臂控制等,在ICCV、AAAI、IROS、RSS等期刊及会议发表多篇论文。在攻读博士期间,她曾在滴滴AI Lab、美的家庭服务机器人、北京人型机器人创新中心担任算法实习生。,为大家着重分享她们团队的工作。如果您有相关工作需要分享,欢迎文末联系我们。,为大家着重分享他们团队的工作。:3D视觉工坊很荣幸邀请到了香港城市大学博士后研究员。3D视觉工坊很荣幸邀请到了香港城市大学博士后研究员。3D视觉工坊哔哩哔哩。
2025-11-24 07:02:12
100
socket通信技术
2018-01-23
GBK.h QT中显示中文
2018-01-18
socket通信界面程序
2018-01-24
粒子滤波在图像领域的跟踪
2018-04-25
PCL1.8.0+VS2013+Win10 x64的配置教程
2018-05-08
如何在Linux下使用“linuxdeployqt”源码打包发布Qt程序
2022-07-18
ubuntu下基于Clion+QT编写的界面demo,适合入门
2022-07-11
linux下TCP通讯助手
2022-06-30
本demo主要实现ubuntu下实现与PLC以及机械臂之间的TCP网络通讯,并将C++代码编译成可以供C函数直接调用的C库。
2022-06-22
Windows下TCP通讯实战demo及TCP助手
2022-06-03
Linux下的TCP通讯实战demo以及通讯助手下载
2022-06-03
UKF(无迹卡尔曼滤波)
2020-12-03
particle_filter_demo.zip
2020-12-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅