非线性二人零和博弈的最优设计
1. 神经网络标识符相关内容
1.1 辅助误差动态与标识符权重估计误差动态
在相关研究中,存在一个调整参数 $\alpha_I$,满足 $0 < \alpha_I < 1$。将更新律(7.19)应用到辅助误差动态(7.17)中,辅助误差动态 $E_{I,k+1}(\tau,\gamma,\Xi)$ 可表示为:
[E_{I,k+1}(\tau,\gamma,\Xi)=\alpha_IE_{I,k}(\tau,\gamma,\Xi),\quad \forall k = 0,1,\cdots,N - 1]
为了使用在线神经网络标识符学习 NNCS 控制和干扰系数矩阵 $G(z)$、$H(z)$,$E_{I,k}[Z_k(\tau,\gamma,\upsilon,\beta)]$ 必须在足够长的时间内持续激励(PE)。即存在一个正常数 $\zeta_{min}$,使得 $0 < \zeta_{min} \leq E_{I,k}[Z_k(\tau,\gamma,\upsilon,\beta)]$ 对于 $k = 0,1,\cdots,N$ 成立。
识别误差动态(7.16)可表示为:
[E_{I,k + 1}(\tau,\gamma)=E_{I,k}(\tau,\gamma)+\left[W_{I,k}^T\upsilon_k(\beta)\right]+\varepsilon_{I,k},\quad \forall k = 0,1,\cdots,N - 1]
其中,$\widetilde{W} {I,k}=W_I - \widehat{W} {I,k}$ 是时间 $kT_s$
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



