Shilong Wang-优快云博客

原创雷达 IMU 标定：hku-mars/Lidar_IMU_Init

标定结果为Lidar->IMU使用匀速运动模型去畸变的Fast-lio2得到激光里程计，通过将激光雷达原始帧分割成多个子帧来提高激光里程计的频率。激光里程计输出每帧扫描结束时刻tk雷达的角速度ωLk和线速度GvLk。IMU原始数据提供角速度ωmi和线加速度ami。当满足足够激励的数据收集完毕，就启动初始化模块，输出时间偏移ItL∈R，外参ITLIRLIpL∈SE3，IMU偏置bω。

2025-12-07 17:55:15 785

原创 L1 Loss 与 L2 Loss 对比

角度L1 LossL2 Loss是否被 outlier 影响✅ 低❌ 高梯度稳定性✅ 高❌ 误差大时爆炸适合 VLA 动作回归吗✅ 适合可能不稳定预测统计量中位数均值L1 Loss 之所以更鲁棒，是因为它不会对大误差给予超线性惩罚，因此不会被异常动作数据带偏训练方向。

2025-11-11 14:33:43 666

参数估计方法对比摘要本文系统对比了三种主流参数估计方法：MLE（最大似然估计）、MAP（最大后验估计）和Full Bayes（完全贝叶斯）。MLE追求纯数据驱动的最优解，MAP在MLE基础上引入正则化先验，Full Bayes则保留完整的后验分布。三者形成递进关系：MLE+先验=MAP，MAP+完整分布=Full Bayes。关键区别在于：MLE输出点估计，MAP输出带先验的点估计，Full Bayes输出概率分布。实际应用中，大数据选MLE，需防过拟合选MAP，需量化不确定性的则使用Full Bayes

2025-10-21 11:59:11 911

原创 Tuning and evaluation of Legged-Locomotion

实验摘要：通过对比不同地形训练效果（障碍地形、楼梯地形及混合地形），发现：1）单一地形顺序训练会导致智能体遗忘先前学习内容；2）混合地形训练能有效缓解遗忘效应，综合表现更优（如实验3障碍躲避成功率93.75%、上下楼梯成功率100%/83.3%）；3）训练场景与目标场景越接近，训练效率越高。实验表明混合训练策略在多地形适应性上显著优于顺序训练。

2025-10-10 09:13:27 345

原创多模态视频理解领域 Benchmark 与 Leaderboard 整理

本文系统梳理了多模态视频理解领域的核心基准测试（Benchmark）和排行榜（Leaderboard），为研究者提供评估模型性能的参考框架。重点介绍了7个具有代表性的Benchmark，包括MMBench-Video、Video-MMMU等，涵盖通用视频理解、教育知识获取、3D空间推理等多样化任务。同时整理了4个主要Leaderboard，如OpenCompass司南榜单和SuperCLUE中文评测，帮助研究者跟踪模型性能排名和技术趋势。这些资源覆盖了视频时序推理、跨模态协同等关键评估维度。

2025-09-15 16:08:11 1260

原创强化学习 Reinforcement Learing

设策略网络输出动作概率分布πθ⋅∣stπθ⋅∣stHπθ⋅∣st−∑a∈Aπθa∣stlog⁡πθa∣stHπθ⋅∣st))−a∈A∑πθa∣stlogπθa∣st其中AA是动作空间。不确定性度量：熵值越大，策略选择动作的随机性越强（探索充分）。确定性度量：熵值越小，策略对某些动作的偏好越强（利用当前知识）。问题类型熵正则的作用。

2025-09-10 16:26:13 1120

原创 StreamVLN评测流程

场景/episode 划分与循环。构建评测器与Habitat配置。关闭环境与返回张量化结果。解析参数、初始化分布式。创建仿真环境 Env。单步循环（核心评测）分布式汇总与最终输出。

2025-08-21 10:10:23 715

原创 C++编程实践--表达式与语句

使用auto可以避免编写冗长、重复的类型名，也可以保证定义变量时初始化。但是，auto类型推导规则复杂，需要仔细理解，在使用时应当确保推导的类型符合预期。声明变量具有与函数调用的返回类型相同的类型std::map<std::string, int>::iterator iter = m.find(val);// 避免冗长的类型名声明变量与非基础对象具有相同的类型auto类型推导时忽略引用，可能引入难以发现的性能问题:用auto初始化的变量，普通变量的const修饰会忽略，而指针和引用的。

2025-08-20 19:31:05 862

原创 C++编程实践--常量、枚举、预处理、头文件、命名空间

枚举应当被使用来表示一系列相关的命名常量，并且可以作为一个命名类型使用。如果无法命名枚举，那么这些常量可能不应该通过枚举组织在一起。【反例】如下代码中，一组不相关的命名常量被放在一个枚举中，很难给这样的枚举声明一个合适的有意义的名字。而程序员的意图也许仅仅是想在不同的地方分别使用内部的几个常量。【正例】使用constexpr或const来定义这些不相关的命名常量。宏展开时只做文本替换，在编译时再求值。文本替换后，宏包含的语句跟调用点代码合并。

2025-08-20 19:29:46 1057

原创 C++编程实践--资源管理、标准库、并发与并行

C标准库中的atoi, atol, atoll, atof函数，在字符串转换的结果无法表示成相应的数值时，会导致程序产生未定义行为，并且未提供足够的出错信息。函数的作用是从一个范围中删除所有指定的元素，但是其并不会真正改变容器的大小，而是将要被删除的元素用后面的需要保留的元素覆盖，然后返回需要删除的第一个元素的迭代器。比起平台提供的接口，标准库的接口有更明确的语义（如happens-before关系），在不同平台（包括硬件、操作系统、二进制接口等）上都有相同的行为，有助于写出更正确、更可移植的程序。

2025-08-20 19:29:22 1013

原创 C++编程实践--函数类模板

【例外】当函数的声明遵循了某接口的约定（如虚函数声明），但定义中有些参数未使用，则应当将未使用的参数注释掉，以明确该参数不被使用，被注释掉的参数名应当仍和声明中的参数名一致。或者显式指定出该参数是未被使用的（C++17中提供了[[maybe_unused]]属性）。public:public:std::string Implement::GetName(int /* id */) const // 符合： id在接口实现中未被使用实现C风格的变参函数时，需要从va_arg。

2025-08-20 19:27:29 698

原创 C++编程规范

传递数组时，必须同时传递其长度对于变长数组，不显示传递其长度，会导致使用时无法检验其数据边界对于仅接收定长数组的情况，当前规范要求也显示传递其长度，原因是：存在大量调用者没有保证长度有效性的缺陷存在大量被调用者设计不当，以固定长度处理变长数组的情况不对内容进行修改的指针型参数，定义为const谨慎使用不可重入函数检查入参中的空指针。

2025-08-20 19:27:00 1014

原创 transformers库解析

外层循环 (Epoch): 控制对整个数据集的遍历次数。内层循环 (Update Step / Micro-batch)它是一个复合结构，服务于梯度累积。外半部分按“优化步”迭代，决定了的调用频率。内半部分按“micro-batch”迭代，执行实际的前向/反向传播，并将梯度累积起来。这种设计将数据迭代（epoch）、模型更新（update step）和梯度计算（micro-batch）清晰地分离开来，是现代深度学习训练框架中的一个经典且高效的实现。

2025-08-20 15:40:12 1231

原创大模型基础：Foundamentals of LLM

摘要：自回归生成模型（如GPT）通过逐步预测序列元素（文字、像素等）实现内容生成，核心是Transformer解码器的掩码自注意力机制。其优势在于生成连贯性强，但受限于逐词生成的顺序性。为提升效率，LLM引入past_key_values缓存历史注意力计算结果（key/value），将计算复杂度从O(n²)降至O(n)。该技术与扩散模型形成互补（离散vs连续数据生成），共同推动生成式AI发展。

2025-08-19 22:49:14 826

原创 IsaacLab强化学习

IsaacLab环境是构建强化学习任务的核心模块，通过isaaclab.envs提供基础架构，将仿真场景转化为Gymnasium兼容的环境。其核心是ManagerBasedRLEnv类，通过观察、动作、奖励等管理者组件实现模块化设计。项目通过配置文件（如Go2BaseRoughEnvCfg）定义整个强化学习流程，包括指令生成、状态观测、决策执行和奖励计算等环节。这种方式支持通过修改配置而非代码来定制环境，提高了灵活性和可扩展性。典型应用如四足机器人训练，实现了从仿真到强化学习的完整闭环。

2025-07-22 12:02:29 1522

原创 evo轨迹评估工具

evo工具是一款用于评估SLAM系统轨迹精度的命令行工具，主要包含六个常用命令：evo_ape（绝对位姿误差评估）、evo_rpe（相对位姿误差评估）、evo_traj（轨迹可视化与格式转换）、evo_res（结果比较）、evo_fig（图像重载）和evo_config（参数配置）。通过evo_config可设置绘图样式、字体、线宽等参数。evo_traj支持读取bag文件、格式转换和多轨迹可视化。evo_ape和evo_rpe分别计算轨迹的全局一致性和局部漂移误差。evo_res可用于对比不同评估结果。该

2025-07-10 21:45:54 1278

原创 Object 6D Pose Estimation

物体6DoF位姿估计方法综述本文综述了基于模板的物体6DoF位姿估计方法。核心问题是通过RGB或深度输入，估计物体在相机坐标系下的6维位姿。现有方法主要分为两类：基于特征匹配的流程（如NeRF-Pose、OnePose等）和渲染比较流程（如Foundation-Pose、Any6D等）。前者依赖特征提取与匹配，后者通过比较渲染与观测图像优化位姿。文章还介绍了FreeZe等零样本方法，利用几何与视觉基础模型协同工作。当前方法仍面临遮挡、对称性等挑战，未来研究将聚焦于提升鲁棒性和通用性。

2025-07-10 21:45:21 1230

原创三维旋转沿轴分解

本文提出了一种将三维旋转分解为固定参考坐标系绕轴的旋转和正交轴旋转的方法。通过建立优化函数，采用最小二乘法估计，使正交轴旋转角度最小化。推导过程中将目标函数转化为最大化迹函数，并通过求导得到解析解。

2025-07-10 21:43:48 693

原创 IMU误差模型

摘要：惯性测量单元（IMU）包含加速度计和陀螺仪，分别测量线加速度和角速率。理想情况下，它们的坐标系应正交且中心对齐，但实际中存在非正交性、标度误差和偏差等误差。误差分为确定性误差（如偏置、标度、非正交性）和随机误差（如高斯白噪声、偏置随机游走）。确定性误差可通过标定补偿，而随机误差需建模处理。陀螺仪偏置导致角度误差随时间线性增长，加速度计偏置导致位置误差二次增长。高斯白噪声和偏置随机游走分别表现为随机游走和二阶/三阶随机游走误差。SLAM中常用简化IMU模型，仅考虑白噪声和偏置随机游走的影响。

2025-07-10 21:39:30 862

原创动态物体滤除算法

这类方法的基本假设是：如果一个激光点的光路穿过了另一个激光点，那么另一个激光点就是动态点。这个假设逻辑上完全说得通，但实现起来有两个问题：其一，入射角接近90度时的误杀问题，如下图所示，红色箭头指向的旧点因为与新点（五角星）光路很接近，会被误杀掉，考虑到一帧激光点云本身的角度误差、测距误差、光斑影响等，这种误杀会更严重。

2025-07-10 21:37:57 993 1

原创具身语义导航算法总揽

本文概述了机器人导航技术的关键方法与发展趋势。端到端方法主要包括模仿学习（IL）、小脑模型（UCBerkly/SHAI Lab）和基于大模型的技术（LLM），代表性工作包括Nomad、NavDP、NavGPT等。模块化方法涵盖GOAT、VLFM、LM-Nav等。重点学者包括提出HM3D-OVON的Naoki Yokoyama、开发Nomad/ViNT的Dhruv Shah，以及NavDP作者蔡文哲、NavGPT开发者吴奇等。这些研究推动了从特定场景到通用导航的技术演进，尤其大模型技术的应用成为新趋势。

2025-06-18 15:18:59 991

原创具身导航：图像目标导航方法

图像目标导航 ImageGoalNav 在具身导航领域类似于小脑的角色，负责低层级运动规划。本文将综述前沿的图像目标导航算法。

2025-06-17 10:20:20 991

原创语义导航数据集

语义导航常见数据集和仿真器，跟进benchmark最新进展

2025-06-11 15:20:31 1408

原创激光雷达Bundle Adjustment

本文详细解析了港大Mars实验室的激光Bundle Adjustment中的数学问题

2025-06-09 14:05:46 957

原创具身导航：模块化方法

具身导航领域展现智能的两类重要任务：ObjectGoalNav寻物任务和InstructionNav指令跟随任务。解决这两类问题的算法按照架构可以划分为模块化方法和端到端方法。模块化方法即包含明确的感知、规划等模块的算法，本文将综述前沿的模块化方法。

2024-07-25 12:57:23 1189 1

原创回环检测算法：Stable Trangle Descriptor

回环检测是指检测传感器的两次测量（如图像、激光雷达扫描）是否发生在同一场景，它是对于SLAM问题至关重要。STD-LCD可以高效地检测闭环，并提供可靠的闭环几何变换。此外，它可以处理小重叠回环检测的挑战情况。与其他描述符中使用的多边形相比，三角形更稳定，因为三角形的形状是给定边长（或夹角）唯一确定的。此外，三角形的形状对于刚性变换是完全不变的。与关键点附近的的局部描述符相比，三角形的形状是旋转和平移不变的。

2024-01-16 11:25:42 1884 1

原创二分图最大匹配算法：匈牙利、KM

二分图最大匹配：匈牙利算法二分图最大权匹配：KM算法

2024-01-09 14:51:25 1410

原创 livox avia平台搭建

livox雷达数据采集平台搭建

2023-12-31 21:22:02 1121

原创批量估计问题

贝叶斯MAP状态估计：给定先验和观测的最优状态推断,

2023-12-31 15:07:19 526

原创 vscode

vscode的使用

2023-12-15 13:06:41 1450

原创 linux shell

linux shell脚本使用

2023-12-11 11:15:29 964

原创 GCC编译

gcc编译选项详解

2023-12-11 10:54:47 1206

原创 cartographer_ros使用

一文帮助小白安装和使用cartographer_ros

2023-11-24 11:36:17 1058

原创 python常用

在终端激活conda环境的时候按tab不能自动补全activate和环境名。安装后可用tab进行补全。

2023-08-21 23:12:13 303

原创因子图优化

我们常将状态估计问题建模为最大后验估计（MAP）。之所以命名为最大后验估计，是因为它在给定了观测Z的情况下，最大化状态X的后验概率密度pX∣ZXMAPargXmaxpX∣ZargXmaxpZpZ∣XpX上式利用了贝叶斯法则，将后验概率密度表示为观测概率密度pZ∣X与状态的先验概率密度pX的乘积，再利用因子pZ进行归一化。当给定观测Z时，归一化项就与最大后验概率无关，可以被忽略。

2023-05-19 16:59:33 2246

原创 latex论文写作实用工具

latex写作实用工具

2023-05-11 19:49:47 519

原创 Pytorch :从零搭建一个神经网络

pytorch安装，从零搭建一个神经网络并训练测试

2023-03-28 15:59:06 1538

原创 Pytorch : 模型部署

将模型导出为torchscript或onnx，使用libtorch C++API部署或Onnx Runtime部署

2023-03-28 15:56:27 3691

原创 Pytorch : 自动求导

在训练神经网络时，最常用的算法是反向传播算法。在该算法中，参数(模型权重)根据损失函数相对于给定参数的梯度进行调整。损失函数计算神经网络产生的期望输出和实际输出之间的差值。目标是使损失函数的结果尽可能接近于零。该算法通过网络反向遍历来调整权重和偏差，以重新训练模型。这就是为什么它被称为反向传播。为了计算这些梯度，PyTorch有一个内置的微分引擎。它支持任何计算图的梯度自动计算。

2023-03-28 15:53:23 1134

原创 RLOAM/RO-LOAM

基于先验模型优化定位建图的算法：RLOAM\RO-LOAM

2023-03-07 22:18:32 861

清华大学2014年《828信号与系统》考研真题答案与详解.pdf

空空如也