- 博客(58)
- 收藏
- 关注
原创 【学习笔记】线性复杂度微分逆运动学:增广拉格朗日视角深度解析
LoIK算法提出了一种高效求解微分逆运动学的新方法,通过借鉴动力学算法的对偶性原理,将问题转化为线性复杂度优化。核心创新包括混合坐标表示保留运动学稀疏性、增广拉格朗日ADMM框架分解问题,以及递归LQR求解器实现线性时间计算。相比传统QP方法,LoIK在保持精度的同时显著提升了计算效率,尤其适用于高自由度机器人系统。该算法已开源实现于GitHub(https://github.com/Simple-Robotics/LoIK)。
2025-12-08 16:07:07
891
原创 解决 Isaac Lab 中 `module ‘omni.usd‘ has no attribute ‘UsdContext‘` 错误
摘要:在使用Isaac Lab时出现的AttributeError: module 'omni.usd' has no attribute 'UsdContext'错误,通常由扩展缓存损坏或版本不兼容导致。主要解决方案是通过删除~/miniconda3/envs/env_isaaclab/lib/python3.11/site-packages/isaacsim/extscache/目录清理缓存,强制系统重新获取正确扩展版本。若问题未解决,可尝试重新创建conda环境或重装Isaac Lab。该方法比完全重
2025-11-17 00:45:36
250
原创 关于 nvidia-smi: no devices were found 解决方案
摘要:在Ubuntu 22.04系统安装NVIDIA RTX 5070显卡驱动时,尽管按照推荐安装了nvidia-driver-580,但nvidia-smi仍显示"No devices were found"。通过排查发现新硬件兼容性和Secure Boot冲突可能是主因,最终安装开源版驱动nvidia-driver-580-open成功解决问题。经验表明,对于新显卡应优先尝试开源驱动,且系统推荐版本可能并非最佳选择。安装完成后还补充了CUDA工具包以完善开发环境。
2025-11-15 15:30:54
884
原创 【学习笔记】Manipulate-Anything(基于视觉-语言模型的机器人自动化操控系统)
摘要: 论文《Manipulate-Anything》提出了一种无需仿真器特权信息或人工设计的自动化机器人演示生成框架,通过视觉-语言模型(VLM)实现任务分解、多视角动作生成与验证。其模块化设计支持零样本任务执行,在仿真和真实环境中分别取得平均22%和38.57%的成功率提升,生成的数据训练的策略性能接近或超越人类演示。方法在扩展性和通用性上表现优异,但依赖大模型且暂不支持动态交互。该研究为机器人学习提供了低成本、高质量的数据生成方案,推动规模化应用发展。
2025-08-04 23:37:17
611
原创 Matplotlib与PySide6兼容性问题及解决方案
摘要:Python中使用Matplotlib与PySide6进行GUI开发时存在兼容性问题,主要表现为枚举值处理差异、版本限制及交互集成问题。解决方案包括:1) 使用非交互式后端'Agg'避免GUI冲突,但无法交互;2) 降级PySide6至6.2版可能解决部分问题,但影响其他功能。建议根据需求选择方案,非交互场景优先用'Agg',交互场景需控制版本组合,或考虑PyQt5等替代方案。通过虚拟环境隔离和逐步升级可优化兼容性,示例代码展示了两种实现方式。随着生态发展,这些问题有望改善。
2025-08-04 09:52:44
672
原创 【学习笔记】MimicGen: 基于人类演示的可扩展机器人学习数据生成系统
本研究提出了一种突破性的模仿学习数据增强方法MimicGen,通过对象中心分段和跨场景位姿变换技术,将有限的人类演示(200条)泛化为大规模多样化训练数据(50k+条)。系统架构包含片段库构建、动态轨迹生成和物理过滤等模块,支持零样本跨硬件适配。实验表明,该方法显著提升任务成功率(91.7% vs 42.3%)和硬件迁移性能(Panda→UR5e仅下降6.2%),同时将数据收集时间从150小时缩短至20小时。虽然存在动态任务支持不足等局限,但为工业自动化(如汽车装配)提供了高效解决方案,并通过开源代码库和数
2025-07-27 15:15:11
1319
原创 【学习笔记】DexMimicGen:通过模仿学习实现双臂灵巧操作的自动化数据生成
摘要:DexMimicGen系统通过自动化数据生成解决了双臂机器人操作的数据瓶颈问题。该系统能从少量人类演示中合成大量物理有效的训练数据,支持并行、协调和顺序三种子任务类型,涵盖多种机器人形态和复杂操作任务。实验表明,使用生成数据训练的策略成功率显著提升(如拼装任务从3.3%提升至80.7%),并在真实人形机器人罐体分拣任务中达到90%成功率。该系统实现了从真实演示到模拟训练再到真实部署的完整流程,为双臂灵巧操作研究提供了高效的数据解决方案。
2025-07-27 14:44:44
1287
原创 TO、MPC与WBC在机器人控制中的作用与区别对比文档
(1) TO(Trajectory Optimization,轨迹优化)(2) MPC(Model Predictive Control,模型预测控制)(3) WBC(Whole Body Control,全身控制)
2025-05-06 00:39:04
1009
原创 Python中5个提升效率的f-string高阶技巧
在Python 3.6+中引入的f-string不仅是字符串格式化的利器,更隐藏着许多高阶用法。本文将带你解锁5个让代码更简洁高效的f-string技巧,覆盖数据处理、排版展示和调试等场景。
2025-05-03 22:21:42
326
原创 PD vs PID control 简要对比
在机器人控制中,PD(比例-微分)控制和PID(比例-积分-微分)控制是两种经典的控制策略,它们的核心区别在于是否引入积分环节。
2025-04-24 01:30:55
1834
原创 【学习笔记】Gumbel softmax 学习文档
Gumbel-Softmax 是一种用于离散变量的连续近似方法。它可以将离散的分类变量(如 one-hot 编码)转换为连续的概率分布,同时保留可微性,适用于神经网络的反向传播。
2025-04-15 01:47:49
1510
原创 【学习笔记】balanced-loss 实现平衡损失函数的库
balanced-loss是一个功能强大且易于使用的库,特别适合在类别不平衡的场景下使用。它提供了多种损失函数,能够轻松集成到 PyTorch 的训练流程中,适用于分类、分割和多标签任务。通过灵活的参数配置,用户可以根据具体任务需求优化模型性能。是一个用于实现平衡损失函数的 Python 库,专注于解决类别不平衡问题,特别适用于分类和图像分割任务。它提供了多种常用的损失函数(如 Focal Loss、Dice Loss 等),并支持灵活的参数配置。
2025-04-15 01:11:02
993
原创 【CUDA编程】CUDA Warp 与 Warp-Python 对比文档
CUDA Warp 是 NVIDIA GPU 的线程调度单位,由 32 个连续线程组成(Volta 架构后支持独立线程调度)。
2025-04-13 15:15:29
1409
原创 【学习笔记】三维网格近似凸分解方法研究
一种基于碰撞感知凹度度量和树搜索的近似凸分解方法(CoACD),旨在解决三维网格分解中细节丢失与组件冗余的难题。传统近似凸分解方法在保留物体功能细节(如烤面包机插槽、茶壶出水口)和碰撞条件方面存在不足,导致下游物理仿真和机器人交互失效。传统凹度指标(如体积差或边界距离)无法全面衡量分解质量,导致中空结构被填充或细长孔洞被忽略。:引入GPU并行加速切割与搜索过程;通过点-面距离优化采样效率,确保表面细节(如凹槽深度)被精确捕捉。,解决了传统凸分解方法在细节保留与碰撞条件维护上的缺陷。
2025-04-13 00:41:42
1352
原创 【学习笔记】两个类之间的数据交互方式
如果交互简单,优先使用方法调用。如果需要解耦,考虑事件、回调或设计模式。避免直接访问另一个类的内部数据,遵循封装原则。
2025-04-12 18:03:13
459
原创 ExternalProject_Add 使用手册与文档详解
ExternalProject_Add是 CMake 的一个核心命令,用于在构建过程中集成和管理外部项目(如第三方库)。它支持完整的生命周期管理,包括下载、配置、构建、安装和测试。
2025-04-08 02:17:42
1357
原创 【学习笔记】MeshCat: 基于three.js的远程可控3D可视化工具
MeshCat 是一个基于three.js构建的远程可控 3D 查看器, 特别适用于机器人学和仿真领域。它可以与 Python 结合使用,提供交互式的 3D 可视化功能。用户可通过浏览器访问 MeshCat 界面,并通过 WebSocket 发送几何指令动态构建场景树。}"MeshCat 是一个强大的 3D 可视化工具,适用于各种机器人学和仿真应用。通过简单的 Python 代码,你可以轻松地创建和操作 3D 场景。希望这个案例能帮助你快速上手 MeshCat。
2025-04-08 00:22:24
1379
原创 【学习笔记】CoACD: 基于碰撞感知凹性与树搜索的近似凸分解
CoACD(Convex Approximation of Complex Decompositions)是一种用于将复杂网格分解为多个凸包的算法, 专为 3D 网格设计了近似凸分解算法,强调在保持物体间潜在碰撞条件的同时减少组件数量,优化了后续应用中的精细且高效的对象交互。该算法在计算机图形学、物理模拟和碰撞检测等领域有广泛应用。
2025-04-07 22:24:09
1400
原创 无锁队列简介与实现示例
无锁队列是一种数据结构,旨在在多线程环境中实现高效的并发访问,而无需使用传统的锁机制(如互斥锁)。无锁队列通过使用原子操作(如CAS,Compare-And-Swap)来确保线程安全,从而避免了锁带来的开销和潜在的死锁问题。
2025-04-06 22:57:52
687
原创 【学习笔记】Toppra: 最优时间运动规划库
toppra是一个用于轨迹优化的 Python 库,特别适用于机器人运动规划。它的全称是 “Time-Optimal Path Parameterization for Robotics Applications”。toppra主要用于在给定路径上进行时间最优参数化,同时满足速度和加速度等约束条件。
2025-04-06 18:53:52
1130
原创 【学习笔记】Ruckig: 高效实时运动规划库
Ruckig 是一种实时轨迹生成器,允许机器人和机器即时响应传感器输入。Ruckig 从任意初始状态开始,计算到目标路径点(包括位置、速度和加速度)的轨迹,并受限于速度、加速度和加加速度约束。除了目标状态外,Ruckig 还允许定义中间位置以进行路径点跟踪。对于状态到状态的运动,Ruckig 保证时间最优解。通过中间路径点,Ruckig 联合计算路径及其时间参数化,与传统方法相比,生成的轨迹显著更快。
2025-04-06 18:28:57
2181
4
原创 【学习笔记】Gymnasium入门(一)
强化学习(Reinforcement Learning, RL)是一种机器学习方法,通过与环境的交互来学习如何采取行动,以最大化累积奖励。强化学习在机器人控制、游戏 AI、自动驾驶等领域有广泛应用。
2025-04-06 17:33:59
1090
1
原创 Unicode 符号在程序开发中的应用指南
在现代软件开发中,Unicode 符号能够帮助我们创建更直观、更易读的用户界面和日志输出。本文将介绍一些常用的 Unicode 符号及其应用场景。
2025-03-21 12:07:04
502
原创 Ubuntu切换默认python版本
update-alternatives 是一个用于管理符号链接的工具,它允许你在系统中安装多个版本的同一个程序,并方便地在它们之间切换。
2025-03-13 00:36:19
983
原创 固定串口设备别名方法
在使用串口设备时,有时需要为设备分配固定的别名,以便更方便地进行访问和管理。本文将介绍如何在 Ubuntu 系统上通过创建 udev 规则来实现这一目标。
2025-03-12 01:53:16
565
原创 Ubuntu 22.04 无法进入图形界面的解决方法
Ubuntu 22.04 无法进入图形界面,只能进入 tty,可能是由于图形界面相关的配置或驱动程序出现了问题。
2025-03-11 16:04:18
7185
原创 使用 `watch` 命令监控系统和进程状态
watch是一个功能强大的 Linux 命令行工具,用于周期性执行命令并实时显示输出结果。它特别适合监控系统状态、进程运行和资源使用情况。
2025-03-07 09:50:38
497
原创 Jetson NV 上解决 PyQt5 “Could not load the Qt platform plugin ‘xcb‘“ 错误
这是由于缺少显示环境或 Qt 平台插件的问题。
2025-03-06 23:10:14
1116
原创 Python可视化进度条库使用说明
tqdm是一个快速、可扩展的进度条库,名称来源于阿拉伯语 taqaddum (تقدّم),意为"进展"。它可以在循环或迭代过程中显示进度,让用户直观地了解程序执行的状态。
2025-03-06 14:22:35
712
原创 Open3D 教程学习指南 (持续整理)
Open3D 是一个开源库,旨在为 3D 数据处理提供高效且易用的工具。它由 Intel 开发和维护,支持多种 3D 数据处理任务,如点云处理、3D 重建、几何处理和可视化等。
2025-03-04 19:58:16
4921
原创 Python优化控制大寰PGC夹具的串口通信程序
在工业自动化中,夹具的控制是一个非常重要的环节。本文将介绍如何使用Python通过串口控制大寰PGC夹具。我们将使用异步IO和事件锁来实现半双工通信,以提高通讯效率和鲁棒性。
2025-03-01 01:37:07
1109
原创 libpython3.9.so.1.0: cannot open shared object file: No such file or directory 解决方法
这个错误通常是由于系统找不到共享库文件。
2025-02-28 14:35:04
1518
原创 symbol version Qt_5_PRIVATE_API not defined in libQt5Gui.so.5 解决方法
这里写自定义目录标题欢迎使用Markdown编辑器symbol version Qt_5_PRIVATE_API not defined in libQt5Gui.so.5 with link timeQT_5 not define in file libQt5Core.so.5 with link time reference.原因是环境出现不兼容的情况通过pip list可知pyqt5 (5.13.2)PyQt5-sip (12.7.0)可把pyqt5 卸载了,pip uninstall
2025-02-28 14:32:40
533
原创 非对称圆 标记技术详解
非对称圆标定板通常由一系列排列成非对称图案的圆形标记组成。这种非对称性使得标定板的方向可以被唯一确定,从而在相机标定和三维重建等应用中提供精确的空间参考。非对称圆标定板的设计旨在确保每个标记点在图案中的位置都是唯一的,这样可以避免在识别过程中出现歧义。非对称圆标定板在相机标定和三维重建中具有重要应用。通过合理的图像处理和几何分析方法,可以实现对非对称圆标定板的准确识别和定位。非对称圆标定板在识别过程中,通过将检测到的圆形标记与预定义的非对称圆标定板模板进行匹配,可以确定标定板的具体位置和方向。
2025-02-27 21:19:53
485
原创 CCTag 标记技术详解
CCTag 标记技术通过独特的同心圆编码方式,实现了高精度、高鲁棒性的标记识别。尽管其计算成本较高,但在需要高精度定位和识别的应用中,CCTag 具有显著的优势。未来,随着计算能力的提升和算法的优化,CCTag 有望在更多领域得到应用和推广。希望本文能帮助读者更好地理解 CCTag 标记技术,并在实际应用中充分发挥其优势。
2025-02-27 13:31:48
1033
原创 libEGL warning: FIXME: egl/x11 doesn‘t support front buffer rendering 解决方法
通过以上两种方法,你可以有效地解决的问题。第一种方法适用于临时抑制日志输出,而第二种方法则是从根本上解决问题。希望这些方法对你有所帮助!更多详细信息请参考EGL 文档。
2025-02-27 11:25:15
1118
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅