博弈动力学中的时间膨胀原理
1. 引言
冲突控制过程的数学理论(微分博弈、动态博弈)拥有广泛的基础方法,用于研究在冲突和不确定条件下运行的各种自然控制过程。在解决博弈动态问题时,构建双方最优行为的尝试不可避免地会导向动态规划的思想,这与微分博弈理论中的主要方程——Hamilton–Jacobi—Bellman–Isaacs方程密切相关。在集合的层面上,这些思想也体现在Pontryagin–Pshenichnyi反向程序中,包括交替积分法和半群算子Tε法。
在冲突控制过程中,每一方在对抗过程中,一方最大化而另一方最小化收益泛函,因此冲突控制过程的优化就转化为根据各方当前可用信息计算泛函的连续最大最小或最小最大值。然而,寻找博弈动力学问题中对抗双方的最优解会遇到很大的数学困难。为此,人们创造了许多有效的数学方法来解决动态博弈问题,这些方法能提供有保证的结果,并给出实现目标的充分条件,而不必过于担心最优性,从实际角度来看,这是完全合理的。这些方法包括L.S. Pontryagin的第一直接法、N.N. Krasovskii的极值瞄准规则、程序迭代法和解析函数法等。
在冲突控制过程中,关于过程当前状态的信息通常会有延迟,原因之一是处理信息需要一定时间。有一种方法可以将信息延迟的逼近问题转化为具有完整信息但动态稍有变化的等效问题,然后应用已知的经典方法。在执行诸如拦截移动目标等重要任务时,为了实现目标,追求者在控制资源和(或)动态能力方面需要有一定优势。经典的Pontryagin条件在一般问题陈述中扮演着这样的角色,但在许多冲突情况下,该条件并不成立,例如软相遇问题和振荡过程的追踪问题。
M.S. Nikolskij和D. Zonnevend提出通过引入一个后来被称为时
超级会员免费看
订阅专栏 解锁全文
23

被折叠的 条评论
为什么被折叠?



