ADP论文学习-零和或非零和博弈问题
于 2024-03-25 16:36:52 首次发布
文章探讨了事件触发的确定性策略梯度在处理未知离散时间非线性系统的零和与非零和游戏中的控制问题。数据驱动的自适应动态编程方法被应用于多玩家系统中,以实现鲁棒控制,尤其是在2022年和2023年的研究中由YongweiZhang等人提出的相关进展。
文章探讨了事件触发的确定性策略梯度在处理未知离散时间非线性系统的零和与非零和游戏中的控制问题。数据驱动的自适应动态编程方法被应用于多玩家系统中,以实现鲁棒控制,尤其是在2022年和2023年的研究中由YongweiZhang等人提出的相关进展。
1666
325

被折叠的 条评论
为什么被折叠?