- 博客(16)
- 收藏
- 关注
原创 论文阅读-BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird’s-Eye View Representation
多传感器融合对于精确可信的自动驾驶系统至关重要。最近的研究是基于点层级的融合:用摄像头特征增强雷达特征点。然而这种相机-雷达方法丢弃了相机特征的稠密语义信息。妨碍了这种方法的有效性,尤其在语义方向任务(比如3D场景增强)。本文提出BEVFusion,一种高效通用的多任务多传感器融合框架。该方法在共享的BEV空间同意了多模态特征,很好的保留了地理和语义信息。为了达到这个目标,诊断并提升了视图转换中的关键效率瓶颈,通过优化BEV池化,将延迟减少了40×以上。
2025-04-17 16:59:31
794
1
原创 ubuntu20.04 XTDrone平台搭建
这里选择python在3.12以下,3.12以上的python安装不了第二个依赖环境。由于python环境和依赖的问题,这里是在虚拟环境中进行的。查看gazebo版本,作者是gazebo9。这就是运行中出现的问题及解决。出现gazebo画面就可以。安装XTDrone后运行。建议写入bashrc中。结束gazebo进程。
2025-04-10 16:22:13
310
原创 论文阅读记录3-EMBODIEDCITY: A BENCHMARK PLATFORM FOR EM-BODIED AGENT IN REAL-WORLD CITY ENVIRONMENT
具身AI强调智能体生成人类行为,最近的研究是构建具身智能的机器学习模型,使其具有感知,规划,行为能力,从而与真实世界交互,但目前主要在于对于室内以及工厂环境的探索,对于室外开阔环境探索缺少,其中的一个潜在原因可能是缺少高质量的数据测试集。本文构建了一个用于评估现实城市环境中具身智能的基准平台。具体来说,首先基于真实城市的建筑物、道路和其他元素构建了一个高度逼真的3D模拟环境。在这个环境中,将历史收集的数据与模拟算法相结合,以高保真度进行行人和车辆流量的模拟。
2025-04-09 18:47:28
829
1
原创 论文阅读记录2
使用LLMs和VLMs进行复杂环境探索,例如将语义和拓扑映射转为导航,但地理信息缺失阻碍了空间推理能力,同时为了改进而提出的自我信息输入容易导致此次优化问题,因此本文提出新的方法通过自我适应全局和主体进行整合,动态匹配全局信息和局部感知,在实验以及指标上进行了对比在我们目前的研究中,我们利用VLM来描述每个标记的周围环境,并随后将文本反应存储在地标语义记忆中。这种方法在很大程度上依赖于VLM的空间理解和推理能力,并可能导致重要语义信息的潜在丢失。
2025-04-07 21:30:33
1159
1
原创 论文阅读记录
提出目前DMPC,DLPC的问题,从而提出了一种新的基于分布式学习的可扩展多机器人控制预测控制框架。与计算开环控制序列的传统DMPC方法不同,该方法围绕一种计算速度快、效率高的分布式策略学习算法,该算法在不使用数值求解器的情况下为MRS生成显式的闭环DMPC策略。通过在线分布式参与者批判性实现,策略学习在每个预测区间内逐步执行并向前推进。控制策略以近距离方式连续更新,实现了快速有效的策略学习,并保证了闭环稳定性。
2025-04-03 15:41:30
594
1
原创 AirSLAM保姆级复现包含docker
但是这个博客是AIRVO配置,是之前作者发布版本,发现想复现的论文还是有点困难滴!哈哈哈,我今天终于配置结束Airslam的环境了,实现完美复现(对于我来说)最开始一直想自己复现在电脑环境,但是电脑一直没成功,决定用作者的镜像。显示超时,这里按照换源方法没成功,我卸载重新安装了。之后按照教程运行,发现不行,还是自己不够了解。作者的命令不适用,适用于旧版本,亲测这个命令。
2025-03-27 22:22:41
607
原创 YOLOv12Windows及Ubuntu环境搭建
最近的项目使用的是yolov5进行的目标检测。这不是我的工作,但周围感觉都在使用yolo,当然了还有迁移学习,这个之后会在接触学习,阅读了YOLOv12的文章,想着配置学习一下。
2025-03-06 11:17:55
452
原创 QT小白遇到问题
好吧,这是一篇乙方的摸鱼时间的博客,突然要做QT的上位机设计,啥也不知道,从暑假到现在的寒假,一个个界面控件去复制,从一个单纯的界面到现在可以充当调试助手了来运行,之后会进一步进行优化,继续学习争取优化界面以及优化代码结构代码是在有点太多了,应该有办法进行修改,进一步提高审美能力和代码水平。
2025-01-18 21:51:16
253
原创 Windows下QT+Opencv编译
之后camke里保持默认MinGW Makefiles,点击Specify native compilers,选择qt的gcc.g++,再configure。cmake界面按钮: add Entry —>>> BOOL —>>> OPENCV_VS_VERSIONINFO_SKIP 打钩。将生成的qt文件放入对应的qt的mingw73_64\lib\cmake\中。注意勾选WITH_QT WITH_OPENGL,在configure。下载opencv后,新建cmake-build文件夹。
2024-12-21 10:43:41
430
原创 ubunut20.04 复现lvi-sam 实测
哈哈,这是一篇临时其兴的记录,托了好久,之前是配置了LIO-SAM,这次是在ubuntu20.04上配置LVI-SAM,实测可行。
2024-12-03 20:43:48
456
原创 线程与opencv结合初步
电脑Windows没安好opencv的C++版本,这里用了python作为练习,结合菜鸟教程的线程的学习使用运行后就可以出现3个画面框,但如何在一个框里显示3个画面可以下一步研究,还有就是这个函数退出有点卡顿,代码应该可以进一步优化,或者直接删掉终端也可以。
2024-11-18 18:58:28
381
原创 TeXLive安装
之前一直是在用overleaf进行late论文写作,然后最近运行不是很顺利,再编译打不开,学习texlive的安装安装完成后就可以进行latex编写了,可以直接去期刊找需要模板导入就可以,构建运行就可以了。
2024-08-21 22:52:59
3896
原创 QT5和Opencv打开摄像头电脑
学习的视频:【在Qt项目中调用OpenCV: 访问usb摄像头并实时绘制到QLabel (CMake + VSCode)】 https://www.bilibili.com/video/BV1T44y157si/?用qmake也是可以的报错的:http://t.csdnimg.cn/Pu7qI。
2024-08-14 14:23:28
976
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人