20、绿色安全博弈中基于后悔的解决方案:应对收益不确定性与信息获取

绿色安全博弈中基于后悔的解决方案:应对收益不确定性与信息获取

1. 引言

在基础设施保护领域,Stackelberg安全博弈(SSG)已成功应用。近年来,安全博弈的研究重点转向了绿色安全博弈(GSG),旨在优化有限安全资源在广阔地理区域的分配,以应对环境犯罪,如保护野生动物或渔业资源。

GSG与SSG的不同不仅体现在应用领域,还在于可用数据量。以往SSG研究缺乏大量对手数据,而GSG则基于丰富的对手攻击历史数据,可用于学习能捕捉对手有限理性的行为模型,且认为动物或鱼类密度等领域数据足以精确确定博弈收益。然而,GSG存在四个关键数据问题:
- 虽提出多种对手行为模型,但未在真实数据上评估。
- 真实数据并非总是充足,导致GSG存在各种不确定性,部分领域需处理双方收益的不确定性。
- 某些领域缺乏足够攻击数据来学习对手行为模型,同时还要应对收益不确定性。
- 防御者虽可使用无人机等移动传感器获取多目标信息以降低收益不确定性,但此前缺乏有效利用这些传感器的技术。

为解决这些挑战,本文提出四个关键贡献:
- 首次使用野生动物公园的真实数据验证行为模型的有效性。
- 提出ARROW算法,解决行为最小最大后悔问题,处理对手行为模型下的收益不确定性。
- 提出ARROW - Perfect算法,在无数据学习行为模型时,假设对手完全理性,处理双方收益的不确定性。
- 提出两种新的信息获取启发式方法,利用传感器多目标获取能力降低收益不确定性,并进行了大量实验。

2. 背景与相关工作
2.1 Stackelberg安全博弈

在SSG中,防御者通过优化分配

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值