- 博客(25)
- 收藏
- 关注
原创 2022_TCSVT_RGB-D Semantic Segmentation and Label-Oriented Voxelgrid Fusion for Accurate 3D Semantic
文章名:Rgb - D语义分割和基于标签的体素网格融合实现精确的三维语义映射三维语义地图在各种各样的应用中发挥着越来越重要的作用,特别是对于许多类型的任务驱动机器人。本文提出了一种从RGB - D图像中获取三维语义地图的语义映射方法。与现有的使用3D标注信息作为监督的方法不同,我们专注于精确的2D帧标注,并使用语义融合机制在3D空间中组合标签。
2025-09-10 10:45:09
634
原创 2022_RGB‐D SLAM in Dynamic Environments with Multilevel Semantic Mapping 在动态环境下的多级语义映射
我们设计了一个SLAM系统,在动态环境中同时估计轨迹和构建对象级稠密三维语义地图。协同基于深度学习的,我们通过使用光流和对象之间的关系来利用几何约束来识别那些移动但预定义的静态对象。我们的方法使用无监督算法将深度数据生成的三维点云分割成有意义的簇。然后将3D点簇与深度学习生成的语义线索进行协同,以产生更准确的3D语义地图。在和I上以及在真实的室内环境中对所提出的系统进行了评估。
2025-09-09 16:52:42
738
原创 2023CCC_Real-time Dense 3D Semantic Mapping Using RGB-D Camera 使用Rgb - D相机进行实时稠密3D语义映射
首先,设计了一种,用于分割场景图像并。其次,针对语义建图过程中的帧间跟踪丢失问题,采用ORB - SLAM3系统作为视觉三维语义建图系统的底层架构,提供稳定的相机位姿。第三,设计了,并采用Octo Map三维场景重建模块实现了具有语义信息的稠密三维地图表示,进而提出了基于ORB - SLAM3的视觉三维语义建图算法。
2025-09-03 10:03:27
1146
原创 2023_SG-SLAM: A Real-Time RGB-D Visual SLAM Toward Dynamic 一个具有语义和几何信息的动态场景的实时Rgb - D视觉SLAM
我们提出了SG - SLAM,它是一个基于ORB - SLAM2框架的实时RGB - D语义视觉SLAM系统。首先,SG - SLAM增加了两个新的并行线程:用于和。然后,在跟踪线程中加入结合语义和几何信息的。最后,在语义映射线程中生成三维点云和三维语义对象,发布到机器人操作系统( ROS )系统中进行可视化。
2025-09-02 19:13:41
606
原创 3D语义地图(3D Semantic Mapping)研究现状
3D语义地图(3D Semantic Mapping)是近年来机器人感知与理解领域的研究热点,旨在构建不仅包含空间几何信息,还融入语义属性的三维环境模型。这类地图使机器人能够理解环境中的物体类别、功能和相互关系,从而实现更高层次的智能行为,如语义导航、任务规划和人机交互等。
2025-09-02 14:01:32
527
原创 2020RAL Multi-modal Semantic SLAM for Complex Dynamic Environments 面向复杂动态环境的多模态语义SLAM。
文章名:2020RAL Multi-modal Semantic SLAM for Complex Dynamic Environments 面向复杂动态环境的多模态语义SLAM。本文针对现有SLAM方法在动态环境下的局限性,提出了一种鲁棒性强、计算效率高的多模态语义SLAM框架。
2025-09-02 13:41:59
763
原创 2020RAL SPATIALLM: Training Large Language Models for Structured Indoor Modeling 训练用于结构化室内建模的大型语言模型
模型在布局估计方面给出了最先进的性能,在方面给出了有竞争力的结果。将结构化描述视为通用语言(即, Python)的脚本,并提出以文本形式预测该语言,如图1所示。这种设计选择有几个优点:( i )具有人类可解释性和可编辑性;( ii )它可以很容易地扩展到包括任何新的类,而不影响脚本中的现有内容;并且( iii )它允许我们利用预训练的大型语言模型的强大内置编码能力。我们的目标是通过,该数据集由12328个点云组成。
2025-09-01 17:19:31
703
原创 cuda torch深度学习环境
查看显卡型号lspci | grep -i nvidiahttps://www.nvidia.cn/drivers/lookup/教程(有坑)用下面这句指令安装驱动,否则无法打开图像化界面。sudo ./NVIDIA-Linux-x86_64-525.53.run -no-x-checkhttps://blog.youkuaiyun.com/huiyoooo/article/details/128015155?spm=1001.2014.3001.5506有驱动了输入命令 显示的是驱动能力(能支持多高的CUDA
2025-08-07 15:15:37
365
原创 MDPI2019 | 3D 仿射:使用 RGB-D 传感器数据嵌入局部图像特征以实现视点不变性
当前用于局部图像特征的检测器和描述符无法适应大于25的平面外旋转◦–30◦ . 对这种视点变化的不变性对于许多应用至关重要,,以提高视点不变性。所提出的嵌入在输入RGB-D图像中定位平滑表面,并将其投影到视点不变表示中,从而。我们提出了一种通用的嵌入方法,通过利用输入。
2025-07-29 16:35:26
239
原创 【2023数据集】CID-SIMS:从地轮机器人角度提供语义信息和多传感器数据的复杂室内数据集
为了推进利用语义信息和多传感器数据增强复杂室内场景中SLAM和三维重建性能的研究,我们提出了一种名为CID-SIMS的新颖而复杂的室内数据集,该数据集从地面轮式机器人的视角提供语义注释的RGBD图像、惯性测量单元(IMU)测量和车轮里程表数据。值得注意的是,我们的数据集取得了两项重大突破。通过时空同步地面实况轨迹和三维点云,我们的数据集能够在统一的全局坐标系中评估SLAM和三维重建算法。我们在数据集上评估了最先进的 SLAM 和 3D 重建方法,证明我们的基准是适用的。
2025-07-29 14:57:34
223
原创 低视角下的RGBD图像产生的点云的3D目标检测
本文探讨了低视角3D目标检测的关键挑战与解决方案。主要难点包括目标遮挡、点云密度不均、地面干扰和视角变形等问题。针对这些挑战,提出了数据增强(如视角模拟、地面分割)、网络架构优化(多尺度特征聚合、高度注意力机制)以及多模态融合策略。实验显示,优化方法在低视角场景下mAP提升可达9.5%。文章还推荐了ARKitScenes等专用数据集,提出地面物体召回率等针对性评价指标,并给出轻量化部署、时序融合等实用建议。未来研究方向包括仿真引擎开发、自监督学习等。该研究为扫地机器人等低视角应用场景提供了系统性解决方案。
2025-07-29 14:50:48
824
原创 【2019cvpr】3D-SIS:RGB-D 扫描的 3D 语义实例分割
文章名:3D-SIS: 3D Semantic Instance Segmentation of RGB-D Scans。
2025-07-28 17:58:10
651
原创 WACV_2022_ImVoxelNet_Image_to_Voxels_Projection_for_Monocular_and_Multi-View_General-Purpose
文章名:ImVoxelNet:用于单目和多视图通用3D目标检测的图像到体素投影。
2025-07-28 15:24:35
999
原创 【cvpr2018】基于RGB-D数据的Frustum点网三维目标检测
3D提案”指的是在3D目标检测流程中生成的候选3D边界框或候选3D区域。我们的模型将尺寸/航向(尺寸的NS分数,航向的NH分数)分类到这些预定义的类别中,并预测每个类别的残差数量(高度、宽度、长度的3×NS残差维度,航向的NH-残差角度)。使用已知的相机投影矩阵,可以将2D边界框提升到截头体(由深度传感器范围指定近平面和远平面),该截头体定义了对象的3D搜索空间。以前的方法侧重于图像或3D体素,但通常会掩盖自然的3D模式和3D数据的不变性,我们直接对原始点云进行操作。框住物体在图像中实际可见的部分。
2025-07-28 13:58:11
875
原创 结构光、tof雷达、双目深度相机的区别
测距原理目前主流的深度感知技术包括 iToF、dToF(MEMS、旋转与全固态)、结构光、主动双目和被动双目,它们各自有不同的技术特点和应用侧重。iToF 适用于,如手势识别、人脸识别、交互感知等。它结构紧凑、响应速度快、抗环境光干扰能力强,是消费电子中的热门选择。dToF(MEMS半固态LiDAR与旋转机械LiDAR)具备,是自动驾驶、机器人导航和大场景建图中的标准配置,但机械结构较大、功耗较高。dToF(Flash和OPA全固态LiDAR)则是近年的发展热点。
2025-07-25 16:45:10
384
原创 2025 3D点云目标检测调研
分类一:Anchor-based方法:anchor是预定义的长方体,具有固定的形状,可以放置在3D空间中。(就是先预设好方框)anchor-based的损失函数包括了分类损失、回归损失、偏航角损失等。分类损失常用的是二值交叉熵、Focal loss,回归则是SmoothL1,航向角需要注意使用bin-based航向估计较好。Anchor-free方法:(不需要引入方块的先验)去掉了复杂的anchor设计阶段,可灵活应用于BEV、点视图和Range视图等。
2025-07-25 16:31:06
1145
原创 【2021 CVPR】CenterPoint 基于中心的3D物体检测和跟踪Center-based 3D Object Detection and Tracking
CenterPoint 首先使用关键点检测器检测物体的中心,然后回归到其他属性,包括 3D 大小、3D 方向和速度。在第二阶段,它使用对象上的附加点要素来细化这些估计值。
2025-07-25 14:12:46
945
原创 2021 Deep Learning for 3D Point Clouds: A Survey (2)
每个非空体素向其感受野内的目标位置发送一个。
2025-07-24 16:53:15
919
原创 2021 Deep Learning for 3D Point Clouds: A Survey (1)
点云上的深度学习越来越受到人们的关注,尤其是在过去的五年里。还发布了几个公开可用的数据集,如ModelNet[6]、ScanObjectNN[7]、ShapeNet[8]、PartNet[9]、S3DIS[10]、ScanNet[11]、Semantic3D[12]、ApolloCar3D[13]和KITTI视觉基准套件[14]、[15]。我们的论文是第一篇专门关注点云理解的深度学习方法的论文。!对于3D形状分类,有两种类型的数据集:合成数据集[6],[8]和现实世界数据集[7],[11]。
2025-07-23 17:59:00
1063
原创 新手看过来,Anaconda 创建环境、安装pytorch、安装包package,助你跑通第一个程序。
Pytorch是框架,Anaconda是创建环境的和管理环境的,如果把环境比作房子,那Anaconda就是开发商,管理所有房子的。pytorch的房子里的大框架package(库、包)则是房子的里的不同设施、工具,这样不同房子就有不同的功能了,健身房、厨房等等,Pycharm只是将这些整合起来的一个工具而已。也就是说,有的环境可以跑图像处理算法,有的可以用来处理后端信息,有的可以用来爬虫,有的可以用来处理自然语言NLP等等。
2023-10-22 13:18:40
245
1
原创 Ubuntu挂载硬盘(永久挂载)
save后终端有警告,但是不管它。3、查文件夹地址改地址pwd。这里可能需要权限,sudo。挂载完成7.3T机械硬盘!
2023-10-20 17:10:34
1064
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅