9、增强型轮式移动机器人系统的稳定性分析

增强型轮式移动机器人系统的稳定性分析

1. 自适应律下的动作神经网络设计

为了定义动作神经网络(Action NN)的自适应律,引入了径向基函数神经网络(RBFNN)。函数 $h_2(\bar{\xi}(k))$ 的近似表达式可写为:
$\hat{h} 2(q(k)) = \hat{\omega} {a,2}^T(k)\varphi_{a,2}(v_{a,2}^T\cdot)$ (4.84)
其中,$\hat{\omega} {a,2}(k) \in R^{n {a,2}×1}$ 和 $v_{a,2}$ 分别表示评判神经网络(Critic NN)中隐藏层输出和输入的目标权重;$\varphi_{a,2}(v_{a,2}^T\cdot) \in R^{n_{a,2}×1}$ 是隐藏层的激活函数,可缩写为 $\varphi_{a,2}(k)$;$n_{a,2}$ 表示隐藏层的节点数,评判神经网络的输入由状态给出。

将贝尔曼误差的二次函数定义为评判神经网络要最小化的目标函数:
$h_2(\cdot) = \omega_{a,2}^T(k)\varphi_{a,2}(k) + \sigma_{a,2}(k)$ (4.85)
其中,$\sigma_{a,2}(k)$ 表示动作神经网络的近似误差。

结合式(4.84)和(4.85),可得:
$\tilde{h} 2(\cdot) = (\hat{\omega} {a,2}^T(k) - \omega_{a,2}^T(k))\varphi_{a,2}(k) - \sigma_{a,2}(k) = \varsigma_{a,2}(k

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值