增强型轮式移动机器人系统的稳定性分析
1. 自适应律下的动作神经网络设计
为了定义动作神经网络(Action NN)的自适应律,引入了径向基函数神经网络(RBFNN)。函数 $h_2(\bar{\xi}(k))$ 的近似表达式可写为:
$\hat{h} 2(q(k)) = \hat{\omega} {a,2}^T(k)\varphi_{a,2}(v_{a,2}^T\cdot)$ (4.84)
其中,$\hat{\omega} {a,2}(k) \in R^{n {a,2}×1}$ 和 $v_{a,2}$ 分别表示评判神经网络(Critic NN)中隐藏层输出和输入的目标权重;$\varphi_{a,2}(v_{a,2}^T\cdot) \in R^{n_{a,2}×1}$ 是隐藏层的激活函数,可缩写为 $\varphi_{a,2}(k)$;$n_{a,2}$ 表示隐藏层的节点数,评判神经网络的输入由状态给出。
将贝尔曼误差的二次函数定义为评判神经网络要最小化的目标函数:
$h_2(\cdot) = \omega_{a,2}^T(k)\varphi_{a,2}(k) + \sigma_{a,2}(k)$ (4.85)
其中,$\sigma_{a,2}(k)$ 表示动作神经网络的近似误差。
结合式(4.84)和(4.85),可得:
$\tilde{h} 2(\cdot) = (\hat{\omega} {a,2}^T(k) - \omega_{a,2}^T(k))\varphi_{a,2}(k) - \sigma_{a,2}(k) = \varsigma_{a,2}(k