自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 PPO原理介绍

一般第一个epoch的第一个batch的时候,由于此时新策略等于旧策略,因此新旧策略概率之比等于1,由二中的图也能看出。这个公式中的第二项clip(...)表示rt(θ)不超过后面的范围,若超过则取对应的边界值,最终的目标函数是取裁剪前和裁剪后的最小值,最终的目标是一个下界。上面的 a_t 为 t 时刻的动作,s_t 为 t 时刻的状态,Π_θ(a_t|s_t) 为该状态下执行该动作的概率密度,A_t 是对应的优势函数,E_t[...] 表示对应期望。而策略更新的目标就是找到能让目标函数最大的参数θ组合。

2025-12-18 16:56:59 233

原创 灵巧手调研

本文综述了多种灵巧手的驱动机制与技术特点:耶鲁大学开源欠驱动四指手采用差速器和伺服电机驱动;MLP_V2假肢手采用全驱动电机方案,集成多种传感器和阻抗控制;并联机构灵巧手利用菱形机构实现精确运动;此外还提及生物肌肉驱动方案。各方案在驱动方式、自由度、控制策略等方面各具特色,为机器人灵巧手设计提供了多样化参考。文章还介绍了相关技术术语如差速器类型、阻抗控制、并联机构等核心技术概念。

2025-11-04 18:01:50 835

原创 贝叶斯最优化原理拆解

贝叶斯优化通过构建高斯过程代理模型减少实际目标函数计算。流程包括:1)初始采样训练代理模型;2)模型预测参数性能并与当前最优比较;3)更新模型迭代优化。高斯过程模型利用均值函数和核函数(如RBF、Matern核)计算后验分布进行预测。采集函数(如期望改进EI)指导参数选择,平衡探索与开发。该方法能高效处理小样本问题,通过迭代更新后验分布逐步收敛至最优解,显著降低计算成本。

2025-11-04 17:55:50 458

原创 十分钟入门Openscad

/这是行注释格式//生成一个head模块,便可以在其他地方进行调用head(x);echo(x);cube(x);

2025-10-21 17:13:40 393

原创 关于用matlab和gazebo进行联合仿真

matlab及其拥有的simulink和其他形形色色的工具包,让matlab成为了一个很好的仿真软件,同时matlab还具有很好的数学计算能力,对于机器人运动中的逆解问题,matlab表现出了不俗的能力,因为,后续的仿真,我打算通过matlab进行完成。

2024-10-03 23:30:44 695

原创 用Gazebo/riviz仿真shadow手

sahdow手的仿真,买不起实物的同学可以试一下

2024-09-27 14:40:20 752

原创 对稚晖君开源的dummy机械臂在gazebo中仿真

在gazebo中仿真稚晖君的dummy机械臂流程以及一些注意事项。

2024-09-24 16:52:21 3027 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除