自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 华为昇腾AI | ROS暑期学校 | 四足机器狗基础知识

在步态控制中,编码器提供反馈,以确保关节角度的准确性,帮助机器人维持稳定和控制步态。在步态控制中,力矩用于控制关节的运动,以维持平衡和实现所需的步态。在步态控制中,了解关节角速度有助于控制关节,使机器人实现所需的动作。:二次规划是用于解决机器人步态控制问题的数学优化方法,它帮助优化机器人的运动轨迹,以实现平衡和效率。:矩阵求导用于计算矩阵函数的导数,这在机器人动力学和控制中经常出现,用于推导运动方程和雅克比矩阵。:足端角速度表示末端效应器(例如足端)的旋转速度,这在四足机器人步态控制中用于控制足端的朝向。

2023-10-24 16:47:03 691

原创 强化学习|策略梯度

是一个很好的参数,其中分子qt代表对当前action的打分,所以qt越大代表action越好,那么我们的πt+1会被更新得越大,使其更多的选择这个action。,即对所有state的期望×Vπ,state满足d的分布,概率为d(s),action满足π的分布,概率为π(a|s,θ)。因此ut是Qπ(t)的无偏估计(ut是Ut的一次取值,而Qπ(t)是Ut的期望,所以可以采用蒙特卡洛方法),可以用来近似Qπ(t)。状态价值函数Vπ,是动作价值函数的积分,由于积分掉了A,所以是关于π和st的函数。

2023-10-24 16:21:02 69

module C improve

module C improve

2023-05-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除