分布式随机Stackelberg策略:防御与对抗的博弈
1. 模型与博弈构建
1.1 防御者模型
假设有 $n$ 个目标和 $m$ 个防御者($m ≤ n$)。目标用完全图的节点表示,每个防御者在每个时间 $t$ 位于图中的一个节点。通过为从目标 $i$ 到目标 $j$ 的移动分配成本 $d_{ij}$ 来模拟防御者的受限移动性和节点间的物理距离,且移动成本可能不对称($d_{ij} ≠ d_{ji}$)。每个防御者能与其他防御者通信,以获取某个目标当前是否被其他防御者占据的信息。定义 $S_t$ 为在时间 $t$ 被防御的目标集合。
1.2 攻击者模型
攻击者的目标是通过随时间攻击一个或多个目标来成功渗透系统。如果攻击者在时间 $t$ 攻击目标 $i$,若此时目标 $i$ 没有防御者,攻击者将获得奖励 $r_i ≥ 0$;若有至少一个防御者,攻击者将支付成本 $c_i ≥ 0$。奖励和成本值防御者和攻击者都已知。
考虑两种不同信息水平的攻击者:
- 第一种攻击者能观察到所有目标被至少一个防御者占据的时间比例,但无法观察到防御者的当前位置。
- 第二种攻击者能在一系列时间 $t_1 < t_2 < · · · < t_k$ 观察到一个或多个防御者的精确位置,并基于这些观察在时间 $t > t_k$ 规划攻击策略。
1.3 博弈构建
考虑一个 Stackelberg 博弈,防御者首先选择每个目标被至少一个防御者占据的时间比例。攻击者观察到所选的时间比例后,决定是攻击特定目标还是不攻击任何目标。攻击者的目标是最大化其期望效用,定义为期望奖励减去期望检测成本。防
超级会员免费看
订阅专栏 解锁全文
1744

被折叠的 条评论
为什么被折叠?



