自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_41826102的博客

原创人形机器人CMU-ASAP算法理解

在第一阶段，用重定位的人体运动数据在模拟中预训练运动跟踪策略。在第二阶段，在现实世界中部署策略并收集现实世界数据来训练一个增量（残差）动作模型来补偿动态不匹配。，ASAP 使用集成到模拟器中的增量动作模型对预训练策略进行微调，以有效地与现实世界的动态保持一致。与 SysID、DR 和增量动态学习基线相比，减少跟踪误差。ASAP 实现以前难以实现的高度敏捷运动，展示增量动作学习在连接模拟和现实世界动态方面的潜力。

2025-07-22 00:00:07 1001

原创人形机器人强化学习真机部署

人形强化学习部署

2025-06-04 14:55:00 2225

原创 AMP算法Adversarial MotionPriors，AMP

增加一个鉴别器，用来判断状态转移（st,st+1）是数据集的，还是机器人策略生成的，然后给出一个奖励加到总奖励里，让策略训练的输出动作导致的环境状态转移，变得和数据集一样无法区分，从而实现按数据集的风格来执行任务。

2025-05-29 23:26:14 2173 2

原创 WBC理论及人形WBC代码详解

WBC理论及青龙WBC。

2025-03-01 16:17:03 2356 3

原创 RL机器人数据九

4 交互后返回rew_buf，然后cur_reward_sum += rewards，cur_reward_sum 其中目的是记录每个环境的agent的生存期间的累计的所有奖励。5 rewbuffer是一个长度100的队列，是存储了过去100个已经终止的环境，在每个环境的agent从生存到终止的时间内所获得的所有奖励的和。:是一个字典，每个字典的key对应value形状是（num_envs），字典的key的数量取决于有多少个奖励函数。从step()函数进入，一次MDP过程后，看看只针对奖励，做了什么。

2025-02-26 11:56:13 471

原创 RL 机器人 sim2sim 八

仅记录，谨慎参考。与训练时给定的环境差不多，进行一些简单的修改。例如：地形，噪声，是否Push，走几个环境，指令等等。

2024-12-15 17:37:49 1474

原创 RL 机器人训练理解问题十

会导致动作的平滑性下滑，同时策略的部分假设可能不成立（对某一时刻，策略还是按照100HZ的控制方式给出100HZ下的新的动作，让一个关节0.01s才期望到达的位置，让其0.002s到达，可能会有很大的区别）。如果观测中用到了上次的动作，那么认为应该将第7步之后的动作作为last_action ，作为一个描述上次的动作值，并不限定同样的量纲，仅作为变量形式的参数。（尽管改的是状态的稠密度，不是广度）。也就是说，并行环境并不影响训练的迭代次数，不影响训练的理论时间，影响ep的长度，进而影响训练的质量。

2024-12-11 16:36:51 1413

原创 RL 机器人 --PPO算法代码（）六

这里我们找到最重要的一行，注册。

2024-11-26 21:50:46 1538

原创 isaacLab 机器人运行五

原代码感觉比较乱和不完善，在管理器方式中，并没有给出噪声的配置和运行。需要按direct方式中，自己在cfg文件中定义，ManagerBasedRLEnvCfg中添加相应的运行代码，如下方式。

2024-11-17 21:29:59 1144

原创 IsaacLab 机器人四

仅记录，谨慎参考。

2024-11-16 16:07:06 787

原创 isaacLab 机器人学习三

水平有限，谨慎参考。

2024-11-13 14:20:17 3710

原创 isaacLab 机器人学习记录二

以倒立摆为例.目录：source/extensions/omni.isaac.lab_tasks/manager_based/classic/cartpole。

2024-11-10 17:34:15 1215

原创 isaacLab 训练机器人一

isaac_lab 机器人 RL

2024-11-10 16:34:46 1317

原创 LQR学习设计及使用

3、知乎文章倒立摆。

2023-11-07 18:14:51 156

原创 adams驱动与测量，与matlab 多形式拟合

1 对转动副添加驱动，右键两次选择具体关节，选择驱动函数，及随时间变化关系。4 点击后处理，选择测量中的值，浏览，文件保存为表格（设定路径），htm格式。2 测量：选择连接关节，测量不同值。3 点击仿真，设定仿真时间和步长。

2023-09-17 17:54:16 1271 1

原创 C++计算时间

结果：在循环1亿次：单位（秒）5个三角函数相乘：22.784。单个三角函数：4.648。I的5次方： 0.12。空循环：0.0465。

2023-09-16 11:13:37 496 1

原创 kotlin 第二部分关于JOG界面的全部内容

界面用于机器人JOG界面，功能详情按设计图设计。指令通讯采用GRPC从服务端获取。

2023-09-10 21:40:38 206 1

原创 android 开发第一部分 kotlin Jetpack compose 开发JOG界面

【代码】android 开发 kotlin Jetpack compose 开发JOG界面。

2023-09-10 21:36:58 398 1

原创机器狗开发——keil 建模及任务发送-到达指定点

指令层：用在freeRTOS 中进行任务调度如何到达一个点。bc_hal 是输入及输出。输入为电机参数，输出为电机编码器等参数。

2023-08-22 20:21:42 290 1

原创四足机器人开发宇树

2023-08-22 17:16:27 1866 1

原创四足机器狗：C++ 验证运动学，逆运动学。

【代码】四足机器狗：C++ 验证运动学，逆运动学。

2023-08-22 09:52:56 579 1

原创四足机器狗建模——单腿matlab 建模（示教，三维）

坐标系： B，0,1,2,3 ，4。三自由度，可计算但不考虑末端姿态。

2023-08-22 09:48:24 1998 1

原创四足机器狗单腿建模 - 运动学，逆运动学matlab验证

【代码】四足机器狗单腿建模 - 运动学，逆运动学matlab验证。

2023-08-22 09:43:26 1013 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除