绿色安全博弈中基于后悔的解决方案:应对收益不确定性与信息获取
1. 引言
在基础设施保护领域,Stackelberg安全博弈(SSG)已成功应用。近年来,安全博弈的研究重点转向了绿色安全博弈(GSG),旨在优化有限安全资源在广阔地理区域的分配,以应对环境犯罪,如保护野生动物或渔业资源。
GSG与SSG的不同不仅体现在应用领域,还在于可用数据量。以往SSG研究缺乏大量对手数据,而GSG则基于丰富的对手攻击历史数据,可用于学习能捕捉对手有限理性的行为模型,且认为动物或鱼类密度等领域数据足以精确确定博弈收益。然而,GSG存在四个关键数据问题:
- 虽提出多种对手行为模型,但未在真实数据上评估。
- 真实数据并非总是充足,导致GSG存在各种不确定性,部分领域需处理双方收益的不确定性。
- 某些领域缺乏足够攻击数据来学习对手行为模型,同时还要应对收益不确定性。
- 防御者虽可使用无人机等移动传感器获取多目标信息以降低收益不确定性,但此前缺乏有效利用这些传感器的技术。
为解决这些挑战,本文提出四个关键贡献:
- 首次使用野生动物公园的真实数据验证行为模型的有效性。
- 提出ARROW算法,解决行为最小最大后悔问题,处理对手行为模型下的收益不确定性。
- 提出ARROW - Perfect算法,在无数据学习行为模型时,假设对手完全理性,处理双方收益的不确定性。
- 提出两种新的信息获取启发式方法,利用传感器多目标获取能力降低收益不确定性,并进行了大量实验。
2. 背景与相关工作
2.1 Stackelberg安全博弈
在SSG中,防御者通过优化分配
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



