一类未知非线性系统的最优控制策略
在控制理论领域,对于未知非线性系统的最优控制一直是研究的热点和难点。本文将详细介绍一种基于神经网络的自适应动态规划方法,用于解决一类未知离散时间非线性系统的最优控制问题。
1. 最优控制基础概念
在最优控制问题中,效用函数 (U(x_i, u_i)) 起着关键作用。一般来说,效用函数可以选择为二次型 (U(x_i, u_i) = x_i^T Qx_i + u_i^T Ru_i),其中 (U(0, 0) = 0),且对于任意的 (x_i) 和 (u_i),都有 (U(x_i, u_i) \geq 0)。(\gamma) 是折扣因子,满足 (0 < \gamma \leq 1)。
对于设计的反馈控制,不仅要使系统在集合 (\Omega) 上稳定,还要保证某个指标(如成本函数 (J))是有限的,这样的控制才是可允许的。具体来说,对于状态 (x_k \in R^n),如果控制序列 (u_k^{\infty}) 在紧集 (\Omega \in R^m) 上连续,(u(0) = 0),(x(f)(x_k, u_k^{\infty}) = 0) 且 (J(x_k, u_k^{\infty})) 有限,则称 (u_k^{\infty}) 是关于某个条件(文中标记为 (2))在 (\Omega) 上的可允许控制序列。
设 (A_{x_k} = {u_k^{\infty} : x(f)(x_k, u_k^{\infty}) = 0}) 是 (x_k) 的所有无限时域可允许控制序列的集合。最优成本函数定义为 (J^*(x_k) = \inf_{u_k^{\infty}} {J(x_k, u_k^{\infty}) : u_k^{\infty}
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



