- 博客(2)
- 收藏
- 关注
原创 华为昇腾AI | ROS暑期学校 | 四足机器狗基础知识
在步态控制中,编码器提供反馈,以确保关节角度的准确性,帮助机器人维持稳定和控制步态。在步态控制中,力矩用于控制关节的运动,以维持平衡和实现所需的步态。在步态控制中,了解关节角速度有助于控制关节,使机器人实现所需的动作。:二次规划是用于解决机器人步态控制问题的数学优化方法,它帮助优化机器人的运动轨迹,以实现平衡和效率。:矩阵求导用于计算矩阵函数的导数,这在机器人动力学和控制中经常出现,用于推导运动方程和雅克比矩阵。:足端角速度表示末端效应器(例如足端)的旋转速度,这在四足机器人步态控制中用于控制足端的朝向。
2023-10-24 16:47:03
691
原创 强化学习|策略梯度
是一个很好的参数,其中分子qt代表对当前action的打分,所以qt越大代表action越好,那么我们的πt+1会被更新得越大,使其更多的选择这个action。,即对所有state的期望×Vπ,state满足d的分布,概率为d(s),action满足π的分布,概率为π(a|s,θ)。因此ut是Qπ(t)的无偏估计(ut是Ut的一次取值,而Qπ(t)是Ut的期望,所以可以采用蒙特卡洛方法),可以用来近似Qπ(t)。状态价值函数Vπ,是动作价值函数的积分,由于积分掉了A,所以是关于π和st的函数。
2023-10-24 16:21:02
69
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人