Distributed Optimal Tracking Control of Discrete-Time Multiagent Systems via Event-Triggered Reinforcement Learning,2022, Zhinan Peng ,RuiLuo , Jiangping Hu , Senior Member, IEEE,KaiboShi , Member, IEEE, and Bijoy Kumar Ghosh , Life Fellow, IEEE
对离散时间多智能体系统使用强化学习解决事件触发最优控制问题。与传统基于强化学习的时间触发控制多智能体系统的最优协调控制相比,仅在设计的事件被触发时才更新控制,减少计算量和传输负载。actor-critic网络近似性能指标,并在线学习事件触发最优控制。事件触发权重调整方法与传统的时间触发(周期固定)方法相比,仅在触发时调整actor神经网络的权重参数,权重调整是非周期性的。基于事件触发的actor-critic神经网络以学习事件触发最优控制。
文章目的为设计分布式控制器,所以智能体跟随领导者轨迹。
多智能体处理信息交换上计算量大的问题,传统上控制器和执行器在系统运行过程中常更新,采样周期固定,提出非周期采样的事件触发控制方案。对未知或不精确系统动力学提出事件触发控制器。
Assumption1给出通信图网络具有领导者的生成树,且无重复的边。
定义局部不一致误差及其动力学,对MASs求解最优跟踪控制,以找到最优分布式控制,最小化局部性能指标函数
事件触发控制器,定义触发递增序列,触发条件需要依赖触发误差和状态相关触发阈值。该

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



