Parallel Control for Optimal Tracking via Adaptive Dynamic Programming ,2020,Jingwei Lu, Qinglai Wei, Senior Member, IEEE, and Fei-Yue Wang, Fellow, IEEE
对连续非线性系统求解最优平行控制,与现有的最优状态反馈控制不同,最优平行控制的控制输入被引入到反馈系统中。
但由于反馈系统中控制输入的引入,最优状态反馈控制方法不能直接应用,则提出增广系统和增广性能指标函数。状态反馈系统的李雅普诺夫函数 V e V_e Ve,增广系统李雅普诺夫函数 V p ( e , u e ) V_p(e,u_e) Vp(e,ue)。
因此一般非线性系统转化为仿射非线性系统,分析最优平行控制和最优反馈控制的不同。ADP方法使用评价网络在线近似值函数。李雅普诺夫理论分析闭环系统稳定性,跟踪误差和神经网络权重误差是