冲突条件下运动控制的时间拉伸原理
1. 信息延迟的追逃博弈与完全信息博弈的等价性
1.1 追逃博弈基础设定
在追逃博弈中,冲突控制过程的轨迹可表示为:
[z (t) = g (t) - \int_{t_0}^{t} (f_1 (t, \theta, u (\theta)) - f_2 (t, \theta, v (\theta))) d\theta, t \in [t_0, +\infty)]
其中,(z (t) \in R^n),(R^n) 是实 (n) 维欧几里得空间,(g : [t_0, +\infty) \to R^n) 是连续向量函数。玩家在每个时刻从紧集 (U) 和 (V) 中选取控制量 (u) 和 (v),使其在时间上的实现为勒贝格可测函数。函数 (f_1 (t, \theta, u)) 和 (f_2 (t, \theta, v)) 分别在 (t) 和 (\theta) 上勒贝格可测,在 (u) 和 (v) 上连续。
终端集 (M^ ) 具有圆柱形式:
[M^ = M_0 + M]
其中,(M_0) 是 (R^n) 的线性子空间,(M) 是 (M_0) 在 (R^n) 中的正交补的凸紧集。
用 (\Omega_U) 和 (\Omega_V) 分别表示取值于紧集 (U) 和 (V) 的所有可测函数的集合,分别称为追者和逃者的可允许控制集。追者的目标是在有限时间内,在逃者任意可允许控制下,将系统轨迹 (z (t)) 带到终端集 (M^*)。
1.2 信息延迟对追逃博弈的影响
假设追者获取游戏状态的当前信息存在时间延迟 (\tau (t)),(
超级会员免费看
订阅专栏 解锁全文
28

被折叠的 条评论
为什么被折叠?



