基于遗憾的解决方案:最大化遗憾的价值
在安全博弈领域,准确预测对手行为并有效应对收益不确定性是关键挑战。本文围绕多个行为模型的比较以及两种算法(ARROW 和 ARROW - Perfect)展开,旨在解决这些问题。
1. 行为模型比较
为了找到最适合预测对手行为的模型,我们对 13 种行为模型进行了比较,具体如下:
- SUQR - 3 :具有三个特征的 SUQR 模型,包括覆盖概率、偷猎者奖励(等同于动物密度)和统一的偷猎者惩罚。
- SUQR - 4 :具有四个特征的 SUQR 模型,除了上述三个特征外,还包括到目标位置的距离。
- QR :一种特定的行为模型。
- ϵ - 最优模型 :有八个版本,对手以相等概率选择攻击效用值在最优目标效用值 ϵ 范围内的目标。
- 随机对手模型 :对手随机选择攻击目标。
- 完全理性模型 :确定性地分类哪个目标会被攻击。
我们使用乌干达数据集进行实验,从 2352 次总攻击中随机抽样 20%作为测试数据,其余 80%用于训练 SUQR - 3、SUQR - 4 和 QR 模型。通过绘制接收者操作特征(ROC)曲线分析各模型性能,结果如下表所示:
| 模型 | AUC 值 |
| ---- | ---- |
| SUQR - 4 | 0.73 |
| QR | 0.67 |
| SUQR - 3 | 0.67
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



