20、不确定非线性网络控制系统的最优控制

不确定非线性网络控制系统的最优控制

1. 引言

在网络控制系统(NNCS)中,有限时域最优控制因终端约束问题,比基于无限时域的方案更具挑战性。本文将探讨如何通过结合终端约束,对不确定的NNCS进行有限时域和无限时域的最优设计。

1.1 主要研究内容

  • 一种结合终端约束,用于不确定NNCS的时间驱动随机最优控制NDP方法,涵盖有限和无限时域。
  • 一种新颖的在线标识符,用于获取NNCS的动态特性。
  • 通过Lyapunov和几何序列分析相结合,证明闭环系统的稳定性。

1.2 研究方法概述

采用时间驱动的NDP技术,在存在网络缺陷导致系统动态不确定的情况下,实现NNCS的有限时域随机最优调节。具体步骤包括:
1. 提出一种新型神经网络(NN)标识符,在线学习控制系数矩阵,以放宽NNCS的动态约束。
2. 利用初始可允许控制,引入评判神经网络(critic NN),并以时间前向的方式进行调整,结合HJB方程逼近随机价值函数,同时考虑终端约束。
3. 引入执行神经网络(actor NN),通过最小化估计的随机价值函数生成最优控制输入。

2. 传统非线性最优控制设计与基于HJB方程的解决方案

2.1 系统模型

考虑仿射非线性离散时间系统:
[
x_{d,k + 1} = f_d(x_{d,k}) + g_d(x_{d,k})u_{d,k} + w_k
]
其中,(x_{d,k})、(u_{d,k})和(w_k)分别表示系统状态、控制输入和干扰

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值