65、一类未知非线性系统的最优控制策略-优快云博客

本文链接：https://blog.youkuaiyun.com/python/article/details/153549726

一类未知非线性系统的最优控制策略

在控制理论领域，对于未知非线性系统的最优控制一直是研究的热点和难点。本文将详细介绍一种基于神经网络的自适应动态规划方法，用于解决一类未知离散时间非线性系统的最优控制问题。

1. 最优控制基础概念

在最优控制问题中，效用函数 (U(x_i, u_i)) 起着关键作用。一般来说，效用函数可以选择为二次型 (U(x_i, u_i) = x_i^T Qx_i + u_i^T Ru_i)，其中 (U(0, 0) = 0)，且对于任意的 (x_i) 和 (u_i)，都有 (U(x_i, u_i) \geq 0)。(\gamma) 是折扣因子，满足 (0 < \gamma \leq 1)。

对于设计的反馈控制，不仅要使系统在集合 (\Omega) 上稳定，还要保证某个指标（如成本函数 (J)）是有限的，这样的控制才是可允许的。具体来说，对于状态 (x_k \in R^n)，如果控制序列 (u_k^{\infty}) 在紧集 (\Omega \in R^m) 上连续，(u(0) = 0)，(x(f)(x_k, u_k^{\infty}) = 0) 且 (J(x_k, u_k^{\infty})) 有限，则称 (u_k^{\infty}) 是关于某个条件（文中标记为 (2)）在 (\Omega) 上的可允许控制序列。

设 (A_{x_k} = {u_k^{\infty} : x(f)(x_k, u_k^{\infty}) = 0}) 是 (x_k) 的所有无限时域可允许控制序列的集合。最优成本函数定义为 (J^*(x_k) = \inf_{u_k^{\infty}} {J(x_k, u_k^{\infty}) : u_k^{\infty}