- 博客(106)
- 资源 (3)
- 收藏
- 关注
原创 【线性代数-非线性优化算法】高斯-牛顿法和LM法
方法是否需 Hessian是否需二阶导稳健性收敛速度适用问题梯度下降否否高慢通用牛顿法是是低快(二阶)小规模光滑问题高斯-牛顿否(近似)否中快(残差小时)非线性最小二乘LM 法否(阻尼近似)否高快且稳健非线性最小二乘(首选)否(近似)否高中~快通用大规模问题。
2025-10-20 23:45:00
1554
原创 【机器视觉-基础知识】三角测量(Triangulation)
三角测量(Triangulation)是通过两台(或多台)相机的投影信息,计算空间点三维坐标的一种方法。两个相机的投影矩阵P1P2P_1, P_2P1P2同一空间点在两幅图像中的对应点p1p2p_1, p_2p1p2目标是:求出三维点XXYZ1TXXYZ1T的坐标。三角测量 = 由多视图投影恢复三维点坐标的过程。它是从二维观测到三维几何的关键步骤,与极线约束互为几何对应:极线约束描述“两个点应在同一平面上”,
2025-10-15 23:45:00
870
原创 【三维重建-对极几何】极线约束(Epipolar Constraint)
极线约束(Epipolar Constraint)描述了两幅图像中对应点之间的几何关系。对于两台相机拍摄的同一个三维点PPP,它在两张图像中的投影ppp与p′p'p′p′TFp0p′TFp0其中,FFF是两幅图像之间的基础矩阵(Fundamental Matrix)。概念符号含义极点ee′e, e'ee′另一相机光心在当前图像中的投影位置极线ll′l, l'll′极平面与图像平面的交线极平面由两相机光心与空间点PPP构成的平面。
2025-10-10 23:45:00
891
原创 【三维重建-算法解析】MVS(Multi-View Stereo,多视图立体)
阶段关键词技术代表传统几何时代深度学习时代神经重建时代MVS 是连接“相机几何”与“真实三维世界”的桥梁,它让我们从二维图像中,真正“看见”了三维世界。
2025-10-09 23:30:00
1359
原创 【图像处理-基础知识】SFIT特征解析
SIFT 的尺度不变性来自于高斯尺度空间的构建。给定图像IxyI(x, y)Ixy,在尺度σ\sigmaσLxyσGxyσ∗IxyLxyσGxyσ∗IxyGxyσ12πσ2e−x2y22σ2Gxyσ2πσ21e−2σ2x2y2σ\sigmaσ控制模糊程度,尺度空间通过在不同σ\sigmaσ下对图像进行高斯卷积来实现。SIFT 算法通过。
2025-09-29 23:30:00
803
原创 【三维重建-常用工具】Colmap工具介绍
COLMAP 是一款开源的与软件,能够从多张无序的照片中自动恢复相机参数和三维点云。开发者:Johannes L. Schönberger(最初为苏黎世联邦理工 ETH Zürich 研究)。特点集成稀疏重建(SfM)和稠密重建(MVS)全流程。提供GUI和命令行接口 (CLI),适合入门与批处理。支持GPU 加速(特征提取与 PatchMatch Stereo)。定位:学术界和工业界最常用的 SfM/MVS 工具之一,常用于三维建模、机器人视觉和文化遗产数字化。
2025-09-27 10:43:20
1267
原创 【三维重建-算法解析】SfM(Structure from Motion)
几何关系(基础矩阵、本质矩阵、PnP)优化方法(BA)鲁棒性(RANSAC、多视图一致性)它是从二维图像恢复三维结构的核心技术,广泛应用于SLAM、三维建模、无人机测绘、VR/AR等领域。
2025-09-26 17:05:54
937
原创 【图像处理 - 基础知识】ISP(Image Signal Processor)处理
一个专门的 硬件/软件处理模块,主要任务是把 图像传感器输出的 Raw Bayer 数据 转换成 可用的彩色图像(RGB/YUV),并且进行一系列图像质量优化。集成位置CMOS 传感器内部 ISP部分手机摄像头模组或低端相机模组,传感器本身内置一个简单 ISP。优点:模组输出直接是 YUV 图像,主控只需要解码即可。缺点:可配置性差,图像调校能力有限。SoC 芯片内部 ISP常见于手机 SoC (高通 Snapdragon、苹果 A 系列、华为麒麟)
2025-08-26 17:52:17
1720
原创 【工具安装使用-Jetson】Jetson Orin Nano 刷机和踩坑总结
官网介绍:https://developer.nvidia.com/blog/nvidia-jetson-orin-nano-developer-kit-gets-a-super-boost/AI 性能:Sparse INT8 TOPS 从 40 TOPS 提升至67 TOPS,性能提高约1.7 倍。内存带宽:从约68 GB/s提升至102 GB/s,提升约50%。CPU 频率:从1.5 GHz增至1.7 GHz。电源与功耗模式。
2025-08-25 23:45:00
1499
原创 【工具使用-Docker容器】构建自己的镜像和容器
本文介绍了Docker镜像和容器的基本概念,详细讲解了如何构建和管理Docker镜像,包括: 镜像作为只读模板包含运行所需内容,容器是镜像的运行实例 使用Dockerfile构建包含Ubuntu 22.04、ROS2 Humble、CUDA和PyTorch的完整镜像 镜像构建命令和验证方法 如何将镜像推送到Harbor私有仓库 在Ubuntu系统上安装Docker的详细步骤,包括添加阿里云源 文章提供了完整的Dockerfile示例和详细操作命令,适用于开发环境搭建。
2025-08-20 23:45:00
780
原创 【深度学习-基础知识】单机多卡和多机多卡训练
维度单机多卡多机多卡训练范围一台机器多台机器GPU 通信同机高速互连(PCIe/NVLink)网络跨机(Ethernet/InfiniBand)实现复杂度低高,需要网络配置扩展性受限于单机 GPU 数量高,可扩展到上百 GPU通信开销低高,可能成为瓶颈框架示例。
2025-08-17 23:00:00
1109
原创 【机器人-基础知识】ROS常见功能架构
本文介绍了ROS驱动、节点与Launch文件的基本概念,并详细讲解了两种常见相机接口(UVC和CSI)的特性和应用场景。重点介绍了Linux下的视频设备调试工具v4l2-ctl,包括其安装方法、常用命令(如设备查询、格式设置、参数调整等)。最后概述了多媒体框架GStreamer的基本语法和典型应用场景,包括摄像头预览、视频录制等功能。这些工具和接口在机器人视觉系统中具有重要作用,为开发者提供了便捷的摄像头配置和数据处理手段。
2025-08-15 23:00:00
1063
原创 【机器人-开发工具】ROS 2 (4)Jetson Nano 系统Ubuntu22.04安装ROS 2 Humble版本
本文介绍了在Jetson Nano上配置ROS2 Humble环境的完整流程。首先需要安装NVIDIA提供的JetPack SDK作为基础操作系统和工具包。
2025-08-14 23:00:00
1169
1
原创 【工具使用-深度学习训练跟踪与可视化工具】SwanLab
SwanLab是一个机器学习实验管理工具,支持在线和离线使用。用户可通过pip install swanlab安装,注册账号后使用API key登录。核心功能包括:swanlab.init()初始化实验,swanlab.log()记录数据(支持标量、图像、表格等),以及swanlab.finish()结束实验。SwanLab提供Web端可视化界面展示实验结果,支持离线模式本地运行,并可通过swanlab sync命令将本地实验同步到云端。项目开源地址为https://github.com/SwanHubX/
2025-08-06 13:03:59
568
原创 【机器人-深度估计】双目深度估计原理解析
从像素级匹配代价到稠密视差图的关键处理步骤,其核心目标是通过整合局部邻域或全局上下文的信息,抑制噪声并增强匹配的准确性。代价体用于存储每个像素在不同视差假设下的匹配代价。对光照变化敏感,窗口大小固定易模糊边界。描述符计算稍复杂,且损失精度信息。等图像处理技术提升平滑性和边界精度。两个相机拍摄同一场景,形成左图。在左图和右图的投影点分别为。即可还原每个像素的深度值。,它们之间的水平距离就是。计算复杂,适合浮点图像。对光照变化极强的鲁棒性。对噪声更敏感,不鲁棒。
2025-06-23 23:45:00
1340
原创 【强化学习】PPO(Proximal Policy Optimization,近端策略优化)算法
PPO(近端策略优化)是一种高效的强化学习策略梯度方法,由OpenAI于2017年提出。它结合策略梯度定理、重要性采样和KL散度等技术,通过限制策略更新幅度来稳定训练。核心方法包括PPO-Clip(通过概率比裁剪控制更新)和PPO-KL(添加KL散度惩罚)。PPO利用GAE(广义优势估计)计算优势函数,减少方差并聚焦优于平均的动作。其优势在于训练稳定、实现简单、样本效率高,广泛应用于游戏和机器人控制等领域。算法流程包括数据采样、优势值计算、目标函数优化和策略更新迭代。
2025-06-18 23:45:00
1287
原创 【深度估计 Depth Estimation】数据集介绍
11 个场景(Artroom、Bandsaw、Chess、Curule、Octogons、Pendulum、Skates、Skiboots、Traproom、Ladder、Podium),每场景 1–3 个视角;克隆 KITTI Tracking 基准的 5 条序列(Scene01、Scene02、Scene06、Scene18、Scene20),并引入不同天气(雾、雨)与相机旋转(±15°)变体。同步采集自 3 个城市的 464 个不同室内场景(公寓、办公室、走廊等),20–30 FPS 视频序列。
2025-05-22 00:00:00
1909
1
原创 【强化学习】深度强化学习 - Deep Q-Network(DQN)算法
Deep Q-Network(DQN)结合了Q-learning与深度神经网络,通过卷积网络或多层感知机逼近动作价值函数,并利用经验回放和目标网络技术稳定训练,使其在高维状态空间(如像素)中表现出色。DQN自2015年提出以来,已成为深度强化学习的基石算法,广泛应用于游戏和机器人等领域。其核心原理包括Q-learning的回顾、深度网络逼近Q函数、经验回放、目标网络、损失函数和ε-贪心策略。算法流程涉及初始化、动作选择、存储转移、批量更新、目标网络同步和ε衰减。典型实现步骤包括环境与依赖的安装、Q网络的定义
2025-05-21 00:00:00
1441
原创 【视觉任务】深度估计(Depth Estimation)介绍(2025年更新)
深度估计(Depth Estimation)是指从二维图像或多视图输入中预测场景中每个像素到摄像机的距离,输出通常为深度图。该任务是三维重建、场景理解、自动驾驶与增强现实等下游应用的关键前置步骤。多视几何:基于特征点匹配与三角化重建深度,经典算法包括 SIFT 匹配与光度一致性优化。形状从焦:利用不同焦距图像中的模糊程度估计深度,同样属于几何推导范式。
2025-05-16 15:32:39
1875
原创 【优化算法】协方差矩阵自适应进化策略(Covariance Matrix Adaptation Evolution Strategy,CMA-ES)
CMA-ES(协方差矩阵自适应进化策略)是一种无导数的优化算法,适用于解决非线性、非凸的连续优化问题。其核心在于通过自适应调整搜索分布的均值、协方差矩阵和步长,利用最大似然原则和演化路径两大思想,高效地更新搜索分布参数。算法步骤包括初始化、采样、排序与加权重组、更新演化路径、协方差矩阵更新和步长控制。CMA-ES的优势在于无需梯度信息,能够自适应搜索方向,并具有较强的鲁棒性。以优化n维球函数为例,CMA-ES能够通过迭代使均值收敛至最优解。
2025-05-16 00:00:00
1728
原创 【强化学习】动态规划(Dynamic Programming, DP)算法
动态规划(Dynamic Programming, DP)是强化学习中基于模型(model-based)方法的核心,通过已知的环境模型(状态转移概率和回报函数)利用贝尔曼方程(Bellman Equation)反复计算值函数,从而推导出最优策略。
2025-05-10 00:00:00
2292
原创 【强化学习】强化学习算法 - 马尔可夫决策过程
马尔可夫决策过程 (MDP) 是强化学习 (Reinforcement Learning, RL) 中用于对问题进行数学建模的标准框架。它描述了一个智能体 (Agent) 与环境 (Environment) 交互的过程,其中智能体的目标是最大化其在一段时间内获得的总奖励。MDP 假设环境具有,即未来的状态和奖励只依赖于当前的状态和智能体采取的动作,而与过去的状态或动作历史无关。
2025-05-09 23:00:00
1471
原创 【强化学习】强化学习算法 - 多臂老虎机问题
核心思想:对每个臂aaa的未知奖励参数(例如,伯努利臂的成功概率pap_apa)维护一个后验概率分布。这个分布反映了基于已观察到的数据,我们对该参数可能取值的信念。在每个时间步ttt,为每个臂aaa从其当前的后验分布中抽取一个样本值θa\theta_aθa。这个样本可以被看作是该臂在当前信念下的一个“可能”的真实参数值。选择具有最大采样值θa\theta_aθa的那个臂AtA_tAt。观察所选臂AtA_tAt的奖励RtR_tRt。
2025-05-07 23:00:00
2042
原创 【强化学习】Q-Learning算法 - (Model-Free, Value-Based)
Q 表是一个二维表格,行表示状态(State),列表示动作(Action),单元格存储对应的 Q 值。例如,在迷宫导航问题中,每个位置(状态)对应四个动作(上、下、左、右),Q 表会记录每个动作的预期回报。的数据结构,记录每个状态-动作对的预期累积奖励(Q 值),从而帮助智能体(Agent)在环境中学习最优策略(选择最大化长期奖励的动作序列)。(选择最大 Q 值的动作),但实际选择动作时可能采用随机策略(如 ε-贪婪),即学习过程与执行策略分离。假设智能体需要从起点(左上角)走到终点(右下角),避免陷阱。
2025-05-07 01:00:00
1845
原创 【强化学习】什么是强化学习?2025
强化学习(Reinforcement Learning, RL)是一种机器学习范式,强调智能体(agent)通过与环境(environment)的交互,以试错(trial‑and‑error)的方式学习一套策略(policy),以最大化累积奖励(cumulative reward)。
2025-05-06 20:07:32
2754
原创 【机器人-开发工具】ROS 2(3)常见工具软件安装(2025持续更新......)
colcon是一个命令行工具,主要用于构建和打包软件,特别适用于机器人操作系统(ROS 2)以及其他使用catkin或ament等构建系统的项目。它是为了解决ROS 2中多个包的编译、依赖管理和扩展性问题而设计的,在ROS 2中取代了ROS 1中使用的和等构建工具。colcon简化了代码编译、依赖关系处理以及软件打包的过程。通过colcon,你可以更高效地管理复杂的机器人软件系统。
2025-03-25 15:21:18
921
原创 【工具使用-编译器】VScode(Ubuntu)使用
注:Ubuntu 下 VSCode 默认快捷键与 Windows 版基本一致,若有需要也可通过 “键盘快捷方式” 进行自定义调整。
2025-03-25 15:20:46
740
原创 【机器人-基础知识】标定 - 相机标定全解
相机标定是确定相机成像过程中各个参数的过程,它的核心目标是建立从三维世界坐标系到二维图像坐标系的数学映射关系。内参:描述相机内部光学特性(如焦距、主点位置、像素尺寸、畸变系数等)的参数。外参:描述相机在世界坐标系中的位置和姿态(即旋转和平移)的参数。通过相机标定,我们可以校正镜头畸变、实现图像矫正、并支持诸如三维重建、机器人导航等应用。在针孔相机模型中,三维世界中的一点经过一系列变换后在二维图像平面上成像。外参变换:将世界坐标系下的点转换到相机坐标系内参投影。
2025-03-14 17:29:35
2545
原创 【机器人-基础知识】标定 - 相机内参求解原理(单应性矩阵、内参约束方程)
单应性矩阵(Homography Matrix)是一个平面映射到另一个平面的映射矩阵,即将一个平面上的点映射到另一个平面上。
2025-03-14 16:26:36
1822
原创 【机器人-开发工具】ROS 2 (2)Ubuntu20.04安装ROS 2 Foxy版本
ROS 2 Foxy Desktop版本概述:这是为大多数用户推荐的安装选项,尤其是初学者。它包括了ROS 2的核心组件、构建工具、可视化工具如RViz、命令行工具等,以及一些示例程序。
2025-03-13 12:02:04
3882
原创 【机器人-开发工具】ROS 2(1)介绍
总体来说,ROS2在继承ROS1优秀特性的基础上,通过采用DDS通信、中间件改进、Executor调度以及安全增强等多项关键技术,构建了一个更高效、灵活且安全的机器人软件平台。无论是在工业应用、无人驾驶、还是教育科研领域,ROS2都展现出强大的生命力和广阔的发展前景,是未来机器人系统研发的重要方向。
2025-03-13 12:00:57
1379
原创 【机器人-开发工具】ROS 1(1)介绍
ROS1(Robot Operating System 1)并非传统意义上的操作系统,而是一个为机器人开发设计的中间件框架。它由加州大学、斯坦福大学及其他机构共同推动发展,目的是降低机器人软件开发的复杂性,促进模块化和重用。ROS1通过提供标准化的通信机制和大量的工具,使开发者能够快速搭建和测试机器人系统。
2025-03-13 12:00:26
1550
原创 【机器人-基础知识】欧拉角、旋转矩阵和四元数
欧拉角是一组三个角度,用于描述一个刚体在三维空间中的定向关系。具体来说,它们表示从一个固定参考坐标系到刚体坐标系的一系列旋转。常见的定义方式是将总体旋转分解为三个连续的简单旋转,每次旋转都绕着当前坐标系的某一固定轴进行。例如,一种常用的欧拉角序列是 Z–Y–X(或称为航向、俯仰、滚转顺序),其含义如下:这种分解使得三维旋转问题转化为三个独立旋转角度的叠加。以 Z–Y–X 顺序为例,刚体总旋转矩阵 RRR 可以写成三个旋转矩阵的乘积:R=Rx(ϕ) Ry(θ) Rz(ψ)R = R_x(\phi) \;
2025-03-12 15:07:53
6737
原创 【机器学习-基础知识】统计和贝叶斯推断
概率分布(Probability Distribution)指的是随机变量所有可能取值及其对应概率的集合。它描述了一个随机变量可能取的所有值以及每个值被取到的概率。
2025-03-12 11:26:45
1664
Office_Tool_v8.2.zip
2021-06-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅