- 博客(31)
- 收藏
- 关注
原创 y9000p打开软件延迟
关机之后,去除所有外设(电源,显示器,键盘鼠标等),长按电源键30秒,期间电脑会显示,不用理会。30秒之后正常开机即可(
2025-02-07 09:35:47
220
原创 ubuntu 不显示网络,右上角没有有线设置或以太网
打开设置->网络,仅有VPN和网络代理,没有有线设置或以太网,网络正常的应该如下图所示。或在命令行中通过ifcofig可以查看到网口信息,但是设置中不显示。查看内容是否如下图所示,如下图所示则正常,关闭即可;
2024-10-15 09:27:25
999
原创 解决Vscode无法解析导入“xxxxx”Pylance的问题
在使用Vscode本地或ssh远程调试Python代码时,有时需要导入本地的其他模块,比如通过环境变量$PYTHONPATH指定的包路径,或者通过pip、conda、mim安装的pkg。
2024-10-10 16:22:00
2602
原创 Khronos:动态环境下时空度量语义SLAM的统一方法
这种能力对于需要对较长时间跨度进行推理的各种应用至关重要,包括家庭和服务机器人、工业建筑或工地监测,其中机器人不仅需要在高度动态的环境中操作,而且需要跟踪或推理过去环境的演变,以更智能地高效执行任务。例如,请注意,窗户附近的椅子(右下,3:09)如何在 6:30(右上)出现在地图中,但在机器人于 7:30 重新访问后被标记为不存在并以新姿势重新出现:19(右下)。值得注意的是,碎片只包含积极的观察结果,即有关检测到的对象存在的信息,但不包括它们的缺失信息。最后,将优化后的碎片状态调和来估计场景的时空地图。
2024-10-08 15:30:48
1075
原创 GSLAM——一个通用的SLAM架构和基准
SLAM技术最近取得了许多成功,并吸引了高科技公司的关注。然而,如何同一现有或新兴算法的界面,一级有效地进行关于速度、稳健性和可移植性的基准测试仍然是问题。本文,提出了一个名为GSLAM的新型SLAM平台,它不仅提供评估功能,还为研究人员提供了快速开发自己的SLAM系统的有用工具。GSLAM的核心贡献是一个通用的、跨平台的、完全开源的SLAM接口,旨在处理输入数据集、SLAM实现、可视化和应用程序的统一框架中的交互。
2024-10-07 20:15:56
1127
原创 视觉定位Revisit Anything
准确识别重游地点对于嵌入代理的定位和导航至关重要。这要求视觉表现清晰,尽管摄像机视点和场景外观有很大变化。现有的视觉地点识别管道对“整个”图像进行编码并搜索匹配。这给匹配从不同摄像机视点拍摄的同一地点的两幅图像带来了根本性的挑战:“
2024-10-06 22:03:19
1254
原创 动态slam--Learn to Memorize and to Forget: A Continual Learning Perspective of Dynamic SLAM
由于表达能力和持续学习的创新范式,具有隐式神经表示的同步定位和建图(SLAM)受到了广泛的关注。然而,在动态环境中部署这样的系统尚未得到充分研究。即使对于传统算法来说,这些挑战也是棘手的,因为从。
2024-08-20 16:33:57
951
1
原创 用于自动驾驶的基于立体视觉的语义 3D 对象和自我运动跟踪
我们提出了一种基于立体视觉的方法,用于在动态自动驾驶场景中跟踪相机自我运动和 3D 语义对象。我们建议使用。
2024-07-25 11:17:46
1085
原创 VSO视觉语义里程计
鲁棒的数据关联是视觉里程计的核心问题,其中图像到图像的对应关系为相机姿态和地图估计提供了约束。当前最先进的直接和间接方法使用短期跟踪来获得连续的帧到帧约束,而长期约束则使用闭环建立。在本文中,我们提出了一种新颖的视觉语义里程计(VSO)框架,以使用语义对点进行中期连续跟踪。我们提出的框架可以轻松集成到现有的直接和间接视觉里程计管道中。对具有挑战性的现实世界数据集的实验表明,通过集成我们的语义约束,在自动驾驶的背景下,与最先进的基线相比有了显着的改进。
2024-07-24 16:53:52
744
原创 全景分割动态视觉slam
大多数视觉 SLAM 系统在动态场景中并不稳健。处理场景中的动态对象的方法通常依赖于基于深度学习的方法来检测和过滤这些对象。然而,这些方法无法处理未知的移动物体。这项工作提出了 Panoptic-SLAM,这是一种对动态环境具有鲁棒性的开源视觉 SLAM 系统,即使存在未知物体也是如此。它在状态估计过程中使用全景分割来过滤场景中的动态对象。PanopticSLAM 基于 ORB-SLAM3,这是一种适用于静态环境的最先进的 SLAM 系统。
2024-07-19 11:08:54
1095
原创 DDRNet实时语义分割
语义分割是自动驾驶汽车理解周围场景的关键技术。当代模型的吸引人的性能通常是以繁重的计算和漫长的推理时间为代价的,这对于自动驾驶来说是无法忍受的。最近的方法使用轻量级架构(编码器-解码器或双路径)或对低分辨率图像进行推理,实现了非常快速的场景解析,甚至在单个 1080Ti GPU 上以超过 100 FPS 的速度运行。然而,这些实时方法与基于扩张主干的模型在性能上仍然存在显着差距。为了解决这个问题,本文提出了一系列专门为实时语义分割而设计的高效主干网。所提出的。
2024-07-15 15:19:56
866
1
原创 3DS-SLAM(3D目标检测,动态视觉slam)
环境中可变因素的存在可能会导致相机定位精度下降,因为它违反了同步定位与建图(SLAM)算法中静态环境的基本假设。最近针对动态环境的语义 SLAM 系统要么仅依赖于 2D 语义信息,要么仅依赖于几何信息,或者以松散集成的方式组合它们的结果。在这篇研究论文中,介绍了 3DS-SLAM(3D 语义 SLAM),
2024-07-11 17:21:44
2158
原创 mmseg学习day01
在 MMSegmentation 中,提供了最方便的方式 MMSegInferencer 来使用模型。只需 3 行代码就可以获得图像的分割掩膜。_base_/datasets/cityscapes.py是数据集的基本配置文件。以下示例展示了如何使用 MMSegInferencer 对单个图像执行推理。4)PSPNET举例。
2024-07-10 17:00:57
636
原创 DynaTM-SLAM:针对动态环境设计的鲁棒语义视觉SLAM算法
由于科学技术的进步,已经开发出许多先进的同步定位与建图(SLAM)算法。然而,它们在复杂的现实场景中的实际适用性受到对象静止的假设的严重限制。因此,提高 SLAM 算法在动态环境中的准确性和鲁棒性至关重要。使用语义分割或对象检测对动态环境中的 SLAM 进行了大量研究,但这些方法的一个主要缺点是,
2024-07-10 11:10:13
2603
1
原创 PVO全景视觉里程计
本文提出了 PVO,一种新颖的全景视觉里程计框架,用于实现场景运动、几何和全景分割信息的更全面的建模。该文中的 PVO 在统一视图中对视觉里程计 (VO) 和视频全景分割 (VPS) 进行建模,这使得这两项任务互惠互利。具体来说,本研究在图像全景分割的指导下将全景更新模块引入到VO模块中。该 全景增强 VO 模块可以通过全景感知动态掩模减轻动态物体对相机姿态估计的影响。
2024-07-09 11:16:54
972
原创 RTAB-map:实时高效的SLAM库
Real‐time appearance‐based mapping (RTAB‐Map)是一种基于外观的闭环检测方法,具有良好的内存管理,以满足处理大场景和在线长周期管理要求。RTAB‐Map集成了视觉和激光雷达SLAM方案,并支持目前绝大多数的传感器是一个强大的、开源的Simultaneous Localization and Mapping(SLAM)库,专为机器人和无人驾驶领域设计。它提供了一套完整的解决方案,用于构建三维地图,并在未知环境中进行实时定位与导航。github项目地址RTAB-
2024-07-05 11:24:25
6915
1
原创 CFP-SLAM动态视觉slam
环境中的动态因素会违反SLAM算法的静态环境假设,导致相机定位精度下降。最近,一些相关工作普遍采用语义约束和几何约束相结合的方式来处理动态物体,但是仍然会出现一些问题,比如实时性差,容易把人当成刚体,低动态性能差场景。本文提出了一种基于目标检测和由粗到精静态概率的动态场景视觉SLAM算法CFP-SLAM。该算法结合语义约束和几何约束,计算物体、关键点和地图点的静态概率,并将其作为权重参与相机位姿估计。
2024-07-04 23:04:34
1190
原创 实时全局分割YOSO
在这篇论文中,提出了YOSO,一个实时的全景分割框架。YOSO通过全景内核与图像特征图之间的动态卷积来预测掩码,只需要一次分割就可以同时完成实例分割和语义分割任务。为了降低计算开销,设计了一个特征金字塔聚合器来提取特征图,以及一个用于全景核生成的可分离动态解码器。聚合器以卷积为主的方式重新参数化了插值优先模块,这显著加速了管道的速度,而没有额外的成本。解码器通过可分离动态卷积执行多头交叉注意力,以提高效率和准确性。YOSO是第一个实时全景分割框架,与最先进的模型相比,它能够提供竞争性的性能。
2024-06-26 17:28:31
1490
原创 Removet--SLAM动态障碍物滤除
本文提出了一种新颖的静态点云地图构建算法,称为Removet,用于动态城市环境。仅留下静态点并排除动态对象是户外变化的各种鲁棒机器人任务中的关键问题,并且该过程通常包括将查询与具有动态点的噪声地图进行比较。然而,这样做时,查询扫描和噪声地图之间的估计差异往往会由于不完善的姿态估计而产生错误,这会降低静态地图质量。为了解决这个问题,本文提出了一种基于多分辨率范围图像的错误预测恢复算法。
2024-06-20 15:09:54
2810
原创 CVPR2024:XFeat
我们介绍了一种轻量级而准确的资源高效视觉对应的架构。我们的方法,被称为XFeat(加速特征),重新审视了卷积神经网络在检测、提取和匹配局部特征方面的基本设计选择。我们的新模型满足了对于适用于资源有限设备的快速和稳健算法的迫切需求。特别是,准确的图像匹配需要足够大的图像分辨率------出于这个原因,我们尽可能地保持分辨率的大小,同时限制网络中通道的数量。此外,我们的模型被设计为在稀疏或半密集级别进行匹配的选择,其中每种级别可能更适合不同的下游应用,比如视觉导航和增强现实。
2024-06-18 17:18:40
1183
原创 DeViLoc视觉定位
这项研究解决了在夜间场景、恶劣天气和季节变化等苛刻条件下执行视觉定位的挑战。虽然许多先前的研究都集中在提高图像匹配性能以促进图像之间可靠的密集关键点匹配,但现有方法通常严重依赖于重建 3D 模型上的预定义特征点。因此,他们往往会在匹配过程中。
2024-06-04 20:41:51
569
原创 DDN-SLAM
论文链接:https://arxiv.org/abs/2401.015451、动态环境下的NeRF SLAM方法。2、利用先验的语义信息来分割场景中的静态和动态特征点,构建了用于潜在动态点和约束关键帧的稀疏流约束。3、(重建)提出了基于跳跃体素策略的背景填充策略,相较于传统方法更具成本效益。4、利用语义掩码联合多分辨率哈希编码来实现实时性能、低内存消耗和高质量几何和纹理细节之间的平衡。5、通过合理的像素填充消除了动态物体的干扰,并限制了鬼影伪像的生成。
2024-06-03 09:20:33
563
原创 orbsalm2论文笔记
但是,这带来了将BA输出与地图的当前状态合并的挑战。完整BA完成后,我们需要将更新后的关键帧和关键点子集(完整BA后的)与未更新的关键帧和点合并在一起,这些关键点和点将在优化运行时插入,通过生成树将更新的关键帧的校正传播到未更新的关键帧(即从未优化的姿势转换为优化的姿势), 未更新的点根据参考关键帧的校正进行变换。系统维护一个图(节点和连线),该图链接具有共同点的两个关键帧和连接所有关键帧的最小生成树(生成树是将原图的全部顶点以最少的边连通的子图,权值总和最小的生成树则称为图的最小生成树)。
2023-08-24 10:22:11
191
1
原创 协方差矩阵
1、协方差矩阵在统计学和机器学习中随处可见,一般而言,可视作方差和协方差两部分组成,即方差构成了对角线上的元素,协方差构成了非对角线上的元素。就是方差及协方差在一个矩阵中表现出来。这里就体现了变量间的相关性。
2023-08-22 17:39:06
270
1
原创 Large-Scale, Real-Time 3D Scene Reconstruction Using Visual and IMU Sensors
这里也省略了闭环检测的平均时间。然而,在相机进给抖动、特征较少以及场景中存在运动物体的情况下,使用视觉传感器的传统三维重建系统容易导致三维模型的错位和漂移。现有的基于视觉惯性里程计( VIO )的三维重建系统使用复杂的算法,导致内存消耗大,限制了在移动设备上的适用性。与上述两个系统相比,可以看出,本系统中基于MSKF的VIO的位姿精确计算可以更好地应对白墙和玻璃等特征稀疏的情况。此外,我们提出的三维重建系统在状态向量中保持了一段时间的图像信息和延迟线性化,既保证了算法的准确性,又更有效地利用了资源。
2023-08-21 20:59:35
149
1
原创 编译slam3时出现的问题
主要原因是pcl里有个宏定义HAVE_CUDA正好被Pangolin用起来了(原因不明,可能是路径问题?把Pangolin里的HAVE_CUDA修改成HAVE_CUDA_PANGOLIN进行区分即可。最后把Panggolin进行重新编译。
2023-08-21 13:54:57
232
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人