自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_66398253的博客

原创 PPO原理介绍

一般第一个epoch的第一个batch的时候，由于此时新策略等于旧策略，因此新旧策略概率之比等于1，由二中的图也能看出。这个公式中的第二项clip(...)表示rt(θ)不超过后面的范围，若超过则取对应的边界值，最终的目标函数是取裁剪前和裁剪后的最小值，最终的目标是一个下界。上面的 a_t 为 t 时刻的动作，s_t 为 t 时刻的状态，Π_θ(a_t|s_t) 为该状态下执行该动作的概率密度，A_t 是对应的优势函数，E_t[...] 表示对应期望。而策略更新的目标就是找到能让目标函数最大的参数θ组合。

2025-12-18 16:56:59 233

原创灵巧手调研

本文综述了多种灵巧手的驱动机制与技术特点：耶鲁大学开源欠驱动四指手采用差速器和伺服电机驱动；MLP_V2假肢手采用全驱动电机方案，集成多种传感器和阻抗控制；并联机构灵巧手利用菱形机构实现精确运动；此外还提及生物肌肉驱动方案。各方案在驱动方式、自由度、控制策略等方面各具特色，为机器人灵巧手设计提供了多样化参考。文章还介绍了相关技术术语如差速器类型、阻抗控制、并联机构等核心技术概念。

2025-11-04 18:01:50 835

原创贝叶斯最优化原理拆解

贝叶斯优化通过构建高斯过程代理模型减少实际目标函数计算。流程包括：1)初始采样训练代理模型；2)模型预测参数性能并与当前最优比较；3)更新模型迭代优化。高斯过程模型利用均值函数和核函数(如RBF、Matern核)计算后验分布进行预测。采集函数(如期望改进EI)指导参数选择，平衡探索与开发。该方法能高效处理小样本问题，通过迭代更新后验分布逐步收敛至最优解，显著降低计算成本。

2025-11-04 17:55:50 458

原创十分钟入门Openscad

/这是行注释格式//生成一个head模块，便可以在其他地方进行调用head(x);echo(x);cube(x);

2025-10-21 17:13:40 393

原创关于用matlab和gazebo进行联合仿真

matlab及其拥有的simulink和其他形形色色的工具包，让matlab成为了一个很好的仿真软件，同时matlab还具有很好的数学计算能力，对于机器人运动中的逆解问题，matlab表现出了不俗的能力，因为，后续的仿真，我打算通过matlab进行完成。

2024-10-03 23:30:44 695

原创用Gazebo/riviz仿真shadow手

sahdow手的仿真，买不起实物的同学可以试一下

2024-09-27 14:40:20 752

原创对稚晖君开源的dummy机械臂在gazebo中仿真

在gazebo中仿真稚晖君的dummy机械臂流程以及一些注意事项。

2024-09-24 16:52:21 3027 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除