资源攻防博弈中的策略分析与均衡求解
在资源攻防的场景中,攻击者和防御者的策略选择以及对应的收益情况是一个值得深入研究的问题。下面将详细分析不同情况下的博弈模型,包括全重置和单重置等情况,并探讨其中的纳什均衡。
1. 简单示例:FlipThemF₀(n, n, d, ρ) - 全阈值、全重置
首先考虑一个简单的框架示例。在这个场景中,攻击者成功攻陷单个资源的时间服从速率为λ的指数分布,而防御者以速率为μ的指数分布的时间间隔进行全重置,从而重新掌控所有资源。也可以理解为,单个资源在速率为λ的泊松过程的到达时间被攻陷,状态在速率为μ的泊松过程的到达时间被重置。
这里假设攻击者是隐秘的,即防御者在进行全重置时不知道有多少资源已被攻陷。经过分析可知,在这种情况下,防御者是否隐秘对攻击者的攻击策略影响不大。攻击者会按照特定顺序依次攻击每个资源。
我们将攻击者在时间τ时攻陷的资源数量建模为有限空间S = {0, …, n}中的一族随机变量X = {X(τ) : τ ≥ 0}。由于防御者和攻击者都采用无记忆策略(由无记忆的指数随机变量决定状态变化的时间),所以过程X是一个连续时间马尔可夫链。
根据连续时间马尔可夫链的分析,存在一个|S| × |S|的生成矩阵G,其元素{gᵢⱼ : i, j ∈ S}满足:
[
Pr[X(τ + h) = j | X(τ) = i] =
\begin{cases}
1 + g_{ii} \cdot h + o(h), & \text{if } j = i \
g_{ij} \cdot h + o(h), & \text{if } j \neq i
\
超级会员免费看
订阅专栏 解锁全文
19

被折叠的 条评论
为什么被折叠?



