11、博弈动力学中的时间膨胀原理

博弈动力学中的时间膨胀原理

1. 引言

冲突控制过程的数学理论(微分博弈、动态博弈)拥有广泛的基础方法,用于研究在冲突和不确定条件下运行的各种自然控制过程。在解决博弈动态问题时,构建双方最优行为的尝试不可避免地会导向动态规划的思想,这与微分博弈理论中的主要方程——Hamilton–Jacobi—Bellman–Isaacs方程密切相关。在集合的层面上,这些思想也体现在Pontryagin–Pshenichnyi反向程序中,包括交替积分法和半群算子Tε法。

在冲突控制过程中,每一方在对抗过程中,一方最大化而另一方最小化收益泛函,因此冲突控制过程的优化就转化为根据各方当前可用信息计算泛函的连续最大最小或最小最大值。然而,寻找博弈动力学问题中对抗双方的最优解会遇到很大的数学困难。为此,人们创造了许多有效的数学方法来解决动态博弈问题,这些方法能提供有保证的结果,并给出实现目标的充分条件,而不必过于担心最优性,从实际角度来看,这是完全合理的。这些方法包括L.S. Pontryagin的第一直接法、N.N. Krasovskii的极值瞄准规则、程序迭代法和解析函数法等。

在冲突控制过程中,关于过程当前状态的信息通常会有延迟,原因之一是处理信息需要一定时间。有一种方法可以将信息延迟的逼近问题转化为具有完整信息但动态稍有变化的等效问题,然后应用已知的经典方法。在执行诸如拦截移动目标等重要任务时,为了实现目标,追求者在控制资源和(或)动态能力方面需要有一定优势。经典的Pontryagin条件在一般问题陈述中扮演着这样的角色,但在许多冲突情况下,该条件并不成立,例如软相遇问题和振荡过程的追踪问题。

M.S. Nikolskij和D. Zonnevend提出通过引入一个后来被称为时

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值