不确定非线性网络控制系统的最优控制
1. 引言
在网络控制系统(NNCS)中,有限时域最优控制因终端约束问题,比基于无限时域的方案更具挑战性。本文将探讨如何通过结合终端约束,对不确定的NNCS进行有限时域和无限时域的最优设计。
1.1 主要研究内容
- 一种结合终端约束,用于不确定NNCS的时间驱动随机最优控制NDP方法,涵盖有限和无限时域。
- 一种新颖的在线标识符,用于获取NNCS的动态特性。
- 通过Lyapunov和几何序列分析相结合,证明闭环系统的稳定性。
1.2 研究方法概述
采用时间驱动的NDP技术,在存在网络缺陷导致系统动态不确定的情况下,实现NNCS的有限时域随机最优调节。具体步骤包括:
1. 提出一种新型神经网络(NN)标识符,在线学习控制系数矩阵,以放宽NNCS的动态约束。
2. 利用初始可允许控制,引入评判神经网络(critic NN),并以时间前向的方式进行调整,结合HJB方程逼近随机价值函数,同时考虑终端约束。
3. 引入执行神经网络(actor NN),通过最小化估计的随机价值函数生成最优控制输入。
2. 传统非线性最优控制设计与基于HJB方程的解决方案
2.1 系统模型
考虑仿射非线性离散时间系统:
[
x_{d,k + 1} = f_d(x_{d,k}) + g_d(x_{d,k})u_{d,k} + w_k
]
其中,(x_{d,k})、(u_{d,k})和(w_k)分别表示系统状态、控制输入和干扰
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



