11power-优快云博客

原创华为昇腾AI | ROS暑期学校 | 四足机器狗基础知识

在步态控制中，编码器提供反馈，以确保关节角度的准确性，帮助机器人维持稳定和控制步态。在步态控制中，力矩用于控制关节的运动，以维持平衡和实现所需的步态。在步态控制中，了解关节角速度有助于控制关节，使机器人实现所需的动作。：二次规划是用于解决机器人步态控制问题的数学优化方法，它帮助优化机器人的运动轨迹，以实现平衡和效率。：矩阵求导用于计算矩阵函数的导数，这在机器人动力学和控制中经常出现，用于推导运动方程和雅克比矩阵。：足端角速度表示末端效应器（例如足端）的旋转速度，这在四足机器人步态控制中用于控制足端的朝向。

2023-10-24 16:47:03 871

原创强化学习|策略梯度

是一个很好的参数，其中分子qt代表对当前action的打分，所以qt越大代表action越好，那么我们的πt+1会被更新得越大，使其更多的选择这个action。，即对所有state的期望×Vπ，state满足d的分布，概率为d(s)，action满足π的分布，概率为π(a|s,θ)。因此ut是Qπ(t)的无偏估计（ut是Ut的一次取值，而Qπ(t)是Ut的期望，所以可以采用蒙特卡洛方法），可以用来近似Qπ(t)。状态价值函数Vπ，是动作价值函数的积分，由于积分掉了A，所以是关于π和st的函数。

2023-10-24 16:21:02 138

module C improve

2023-05-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 华为昇腾AI | ROS暑期学校 | 四足机器狗基础知识

原创 强化学习|策略梯度

module C improve

空空如也

原创华为昇腾AI | ROS暑期学校 | 四足机器狗基础知识

原创强化学习|策略梯度