mmq在路上-优快云博客

原创 Fast-livo2 gazebo仿真实践记录

记录fast-livo2的仿真主要修改一些参数。

2025-12-22 17:11:20 321 1

原创 XTDrone mid360+gazebo仿真

最近一直弄yolo算法改进，这个东西大多数都要付费，东西不是很多，下一次出教程记录我艰辛的Yolo改进之旅，越改指标越下降。重温一下仿真吧，查了网上好多教程，发现有些真的不适用呀，还得自己去研究。

2025-12-17 15:40:31 359

原创 LA-Planner初步部署--ubuntu20.04

这个路径规划针对未知且特征受限环境开发的，这类环境强烈依赖于先验环境知识在之前的路径规划方法里。

2025-12-04 15:51:50 185

原创 YOLO-World: Real-Time Open-Vocabulary Object Detection论文阅读

我们提出YOLO-World，这是一种前沿的实时开放词汇检测器，旨在提升现实场景应用中的检测效率与开放词汇能力。本文将主流YOLO模型重构为视觉-语言双模态架构，用于开放词汇的预训练与检测，并提出RepVL-PAN框架——该框架通过网络融合视觉与语言信息，支持参数重置以实现高效部署。我们进一步结合检测、定位及图文数据构建有效的预训练方案，使YOLO-World具备强大的开放词汇检测能力。

2025-10-29 14:53:22 950 1

原创 A General Optimisation‐Based Framework for Global Pose Estimation With Multiple Sensors论文阅读

精准的状态估计是自主机器人面临的核心挑战。为实现局部高精度与全局无漂移的状态估计，通常需要将具有互补特性的多个传感器进行融合。局部传感器（如相机、IMU（惯性测量单元）、激光雷达等）能提供小范围内的精确姿态信息，而全局传感器（如GPS（全球定位系统）、磁力计、气压计等）则能在大范围环境中提供虽存在噪声但全局无漂移的定位数据。本文提出了一种传感器融合框架，通过将局部状态与全局传感器数据融合，实现局部高精度与全局无漂移的姿态估计。

2025-10-28 15:09:35 893

原创 Real-ESRGAN: Training Real-World Blind Super-Resolution with Pure Synthetic Data论文阅读及复现

想做数据集检测，首先是数据复原然后看到了这篇。

2025-10-10 16:25:10 292

原创 SLAM-Former: Putting SLAM into One Transformer论文阅读

本文提出了SLAM-Former，这是一种新的神经方法，它将全部SLAM功能集成到单个变压器中。与传统的SLAM系统类似，SLAM-FORM由前端和后端组成，两者串联运行。前端对连续的单目图像进行实时处理，进行增量映射和跟踪，后端进行全局细化，以确保几何一致的结果。这种交替执行允许前端和后端相互促进，从而提高整体系统性能。综合实验结果表明，与目前最先进的密集SLAM方法相比，SLAM-FORM具有更好或更具竞争力的性能。在这项工作中，我们引入了SLAM-Former，将全部SLAM能力放入单个变压器中。

2025-10-09 21:43:18 1152

原创 XTDrone平台FAST-LIO2与ego-planner结合路径规划部署

之前做了XTDrone平台FAST-LIO2的部署现在将其结合ego-planner进行导航规划，之前查看教程是使用视觉进行定位导航的，现在重新学习。修改advanced_param_xtdrone.xml，这里有视觉信息，不修改会报错显示为输入视觉话题信息。怎么描述，感觉当时觉得很难的问题突然就给解决了，一顿复杂，最近勤更新吧，继续开始学习。还有一个想法就是两个rviz结合在一起启动，写了一个demo，融合的不太好感觉额。改为只使用雷达点云，这里仿真的话题是/scan。

2025-09-23 16:18:35 731

原创 MARSIM仿真平台部署安装及FUEL部署-Ubuntu20.04

map_generator/resource文件夹添加点云图片。发现MARSIM和FUEL放在一个工作空间了冲突，无法运行。看了作者链接发现不能复制,原因可能是缺少公钥，需要添加。这里发现Fuel需要安装现在需要安装。simulator.xml里面修改。发现是自己问题，不是断开运行的。怎么创建一个点云环境教程。现在运行了发现是这样的。

2025-09-22 16:36:18 366

原创 EPIC: A Lightweight LiDAR-Based UAV Exploration Framework for Large-Scale Scenarios

激光雷达点云大范围建图导航受到关注，但点云虽然具有导航信息源，仍需要额外，昂贵环境表示，主要是由于边界检测以及信息增益计算（依赖于内存密集型占用网格地图），还有由于昂贵碰撞检查的路径规划高度计算复杂性这两个原因，因此提出EPIC（(Exploring on PoIntClouds)）框架：基于激光雷达的轻量级无人机探测框架，它直接利用点云数据来探索大规模环境。EPIC提出了一种新的基于点云质量的观测地图，将环境视为一个小面片的集合，并对其观测质量进行评估。它使用空间散列来维护和更新这一质量。

2025-09-22 10:32:54 1003

原创 FERMI: Flexible Radio Mapping with a Hybrid Propagation Model and Scalable Autonomous Data Collectio

多机器人通信在大范围以及遮挡环境中存在挑战，难以预测训练集中不存在的发射机-接收机对信号强度以及需要大量人工数据集建模，因此提出基于物理直接信号路径建模与神经网络结合的混合型方法，能够让无线电信号传播更有效，同时可扩展规划方法用于自主数据集，可以扩展推广到不同团队规模以及完全自主数据收集尽管费米为射电测绘提供了一个灵活而准确的框架，但仍然存在一些限制。首先，我们的方法假设为静态环境，限制了其在动态场景中的适用性。未来的工作可以探索场景布局变化对信号传播的影响。其次，这种方法需要针对每个单独的场景进行培训。

2025-09-19 11:08:59 857

原创 XTDrone部署R3Live

这是已经修改好的imu参数，可以参考之前仿真的激光SLAM的文件。在视觉和激光SLAM部署后成功修改实现R3live，一把辛酸。IMU_Processing.cpp:以下参数。common_lib.h：修改为以下的参数。这里把真实话题改为仿真的/scan。新建launch文件。

2025-08-13 16:05:02 366 1

原创 XTdrone平台部署SLAM算法（视觉以及激光）

注意查看一下orb-slam3是否有build文件，以及查看ThirdParty里面的DBoW2以及g2o还有ROS的build。这里是把Examples——Old的ROS复制到Examples里面了，也可以选择修改sh编译路径。FAST_LIO2的部署是之前都已经弄好了已经试验了数据集，这里的改动主要是avia.yaml文件。本文主要记录XTDrone平台上部署SLAM的历程，提供一些经验。发现运行build_ros.sh找不到地方编译失败。这里主要教了fast_lio的运行。GPU:4070笔记本。

2025-08-12 16:50:06 443

原创大模型本地部署+网页化应用

ps:自动下载出现 Error: listen tcp 127.0.0.1:11434: bind: address already in us。暂时休息一会，然后看到了B站上使用AI的智能机器人聊天的视频，之前有用过这些技术，打算结合一下。好久不见，哈哈，最近在准备研究课题的问题，暂时在是收录文献做框架总结学习中，希望有好的建议。新建文件在/etc/systemd/system/ollama.service。直接重新安装了一下，然后是手动安装就没问题。毕竟还是要学习的研究生呀。有代理监听，重启开机。

2025-08-05 18:39:59 289

原创 Anaconda虚拟环境无法创建-Windows系统

发现创建不了虚拟环境，Anaconda Windows基础。

2025-06-17 16:46:43 431

原创 PTT: Point-Trajectory Transformer for Efficient Temporal 3D Object Detection论文学习

更新一篇最近三维点云目标检测的论文：PTT: Point-Trajectory Transformer for Efficient Temporal 3D Object Detection看一下这篇论文做了啥近期基于LiDAR的3D物体检测器在两阶段提议方法的基础上取得了令人鼓舞的性能。它们首先从第一阶段的密集检测器生成3D框候选，然后采用不同的时间聚合方法。然而，这些方法需要逐帧对象或整个点云，这给内存库利用带来了挑战。此外，点云和轨迹特征仅通过拼接结合，可能会忽略它们之间的有效交互。

2025-05-24 19:11:35 957

原创论文阅读-BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird’s-Eye View Representation

多传感器融合对于精确可信的自动驾驶系统至关重要。最近的研究是基于点层级的融合：用摄像头特征增强雷达特征点。然而这种相机-雷达方法丢弃了相机特征的稠密语义信息。妨碍了这种方法的有效性，尤其在语义方向任务（比如3D场景增强）。本文提出BEVFusion，一种高效通用的多任务多传感器融合框架。该方法在共享的BEV空间同意了多模态特征，很好的保留了地理和语义信息。为了达到这个目标，诊断并提升了视图转换中的关键效率瓶颈，通过优化BEV池化，将延迟减少了40×以上。

2025-04-17 16:59:31 1222 1

原创 ubuntu20.04 XTDrone平台搭建

这里选择python在3.12以下，3.12以上的python安装不了第二个依赖环境。由于python环境和依赖的问题，这里是在虚拟环境中进行的。查看gazebo版本，作者是gazebo9。这就是运行中出现的问题及解决。出现gazebo画面就可以。安装XTDrone后运行。建议写入bashrc中。结束gazebo进程。

2025-04-10 16:22:13 500

原创论文阅读记录3-EMBODIEDCITY: A BENCHMARK PLATFORM FOR EM-BODIED AGENT IN REAL-WORLD CITY ENVIRONMENT

具身AI强调智能体生成人类行为，最近的研究是构建具身智能的机器学习模型，使其具有感知，规划，行为能力，从而与真实世界交互，但目前主要在于对于室内以及工厂环境的探索，对于室外开阔环境探索缺少，其中的一个潜在原因可能是缺少高质量的数据测试集。本文构建了一个用于评估现实城市环境中具身智能的基准平台。具体来说，首先基于真实城市的建筑物、道路和其他元素构建了一个高度逼真的3D模拟环境。在这个环境中，将历史收集的数据与模拟算法相结合，以高保真度进行行人和车辆流量的模拟。

2025-04-09 18:47:28 1095 1

原创论文阅读记录2

使用LLMs和VLMs进行复杂环境探索，例如将语义和拓扑映射转为导航，但地理信息缺失阻碍了空间推理能力，同时为了改进而提出的自我信息输入容易导致此次优化问题，因此本文提出新的方法通过自我适应全局和主体进行整合，动态匹配全局信息和局部感知，在实验以及指标上进行了对比在我们目前的研究中，我们利用VLM来描述每个标记的周围环境，并随后将文本反应存储在地标语义记忆中。这种方法在很大程度上依赖于VLM的空间理解和推理能力，并可能导致重要语义信息的潜在丢失。

2025-04-07 21:30:33 1336 1

原创论文阅读记录

提出目前DMPC,DLPC的问题，从而提出了一种新的基于分布式学习的可扩展多机器人控制预测控制框架。与计算开环控制序列的传统DMPC方法不同，该方法围绕一种计算速度快、效率高的分布式策略学习算法，该算法在不使用数值求解器的情况下为MRS生成显式的闭环DMPC策略。通过在线分布式参与者批判性实现，策略学习在每个预测区间内逐步执行并向前推进。控制策略以近距离方式连续更新，实现了快速有效的策略学习，并保证了闭环稳定性。

2025-04-03 15:41:30 740 1

原创 AirSLAM保姆级复现包含docker

但是这个博客是AIRVO配置，是之前作者发布版本，发现想复现的论文还是有点困难滴！哈哈哈，我今天终于配置结束Airslam的环境了，实现完美复现（对于我来说）最开始一直想自己复现在电脑环境，但是电脑一直没成功，决定用作者的镜像。显示超时，这里按照换源方法没成功，我卸载重新安装了。之后按照教程运行，发现不行，还是自己不够了解。作者的命令不适用，适用于旧版本，亲测这个命令。

2025-03-27 22:22:41 1194 2

原创 Deepseek部署

突发奇想部署deepseek看看。

2025-03-25 19:53:49 274

原创 YOLOv12Windows及Ubuntu环境搭建

最近的项目使用的是yolov5进行的目标检测。这不是我的工作，但周围感觉都在使用yolo，当然了还有迁移学习，这个之后会在接触学习，阅读了YOLOv12的文章，想着配置学习一下。

2025-03-06 11:17:55 731

原创 QT小白遇到问题

好吧，这是一篇乙方的摸鱼时间的博客，突然要做QT的上位机设计，啥也不知道，从暑假到现在的寒假，一个个界面控件去复制，从一个单纯的界面到现在可以充当调试助手了来运行，之后会进一步进行优化，继续学习争取优化界面以及优化代码结构代码是在有点太多了，应该有办法进行修改，进一步提高审美能力和代码水平。

2025-01-18 21:51:16 292

原创 Windows下QT+Opencv编译

之后camke里保持默认MinGW Makefiles，点击Specify native compilers，选择qt的gcc.g++,再configure。cmake界面按钮： add Entry —>>> BOOL —>>> OPENCV_VS_VERSIONINFO_SKIP 打钩。将生成的qt文件放入对应的qt的mingw73_64\lib\cmake\中。注意勾选WITH_QT WITH_OPENGL，在configure。下载opencv后，新建cmake-build文件夹。

2024-12-21 10:43:41 590

原创 ubunut20.04 复现lvi-sam 实测

哈哈，这是一篇临时其兴的记录，托了好久，之前是配置了LIO-SAM，这次是在ubuntu20.04上配置LVI-SAM，实测可行。

2024-12-03 20:43:48 726

原创线程与opencv结合初步

电脑Windows没安好opencv的C++版本，这里用了python作为练习，结合菜鸟教程的线程的学习使用运行后就可以出现3个画面框，但如何在一个框里显示3个画面可以下一步研究，还有就是这个函数退出有点卡顿，代码应该可以进一步优化，或者直接删掉终端也可以。

2024-11-18 18:58:28 521

原创 C++的Cmaketxt文件设置（Linux）

C++的Cmaketxt文件设置（Linux）

2024-10-04 19:24:17 497

原创四分位法学习

最小值：2最大值：90第一分位：5第二分位：10第三分位：17记录一下。

2024-09-04 21:29:45 639

原创 TeXLive安装

之前一直是在用overleaf进行late论文写作，然后最近运行不是很顺利，再编译打不开，学习texlive的安装安装完成后就可以进行latex编写了，可以直接去期刊找需要模板导入就可以，构建运行就可以了。

2024-08-21 22:52:59 5890

原创 QT5和Opencv打开摄像头电脑

学习的视频：【在Qt项目中调用OpenCV: 访问usb摄像头并实时绘制到QLabel (CMake + VSCode)】 https://www.bilibili.com/video/BV1T44y157si/?用qmake也是可以的报错的：http://t.csdnimg.cn/Pu7qI。

2024-08-14 14:23:28 1214 1

m0_56093217的博客