动态环境下的安全时机博弈
1. 离散时间模型
在离散时间模型中,防御者的目标是在时间阶段 ${0, 1, \ldots, K}$ 内将总损失降至最低。防御者的成本计算为:
$\sum_{k = 0}^{K} d(k)$
损失取决于攻击者的等待时间。假设攻击者在第 $k$ 个时间段发现漏洞后等待 $a(k)$ 个时间段再利用该漏洞,那么防御者在第 $k$ 个时间步因发现的漏洞而遭受的损失为:
$(1 - \lambda)^{a(k)} R d(k + a(k))$
综合起来,离散时间模型中防御者的收益为:
$U_d = - \sum_{k = 0}^{K} \left( d(k) + V(k)(1 - \lambda)^{a(k)} R d(k + a(k)) \right)$
攻击者的收益为:
$U_a = \sum_{k = 0}^{K} V(k)(1 - \lambda)^{a(k)} R d(k + a(k))$
2. 模型分析
2.1 连续时间模型中攻击者策略的约束
- 命题 1 :如果 $V(0) > 0$,那么连续时间模型中的每个均衡都满足 $a(0) = 0$ 和 $a(T) = 0$。也就是说,攻击者在游戏开始或结束时不应等待攻击。
- 证明 :假设 $a(0) > 0$,由于攻击者之前没有发现漏洞的时间,防御者可以安全地选择 $d(0) = 0$ 作为最优投资。但如果攻击者知道 $d(0) = 0$,为了在发现漏洞时造成
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



