基于后悔值的安全策略优化与无人机路径规划
在安全博弈领域,数据的稀缺性常常给策略制定带来挑战。为应对这一问题,我们提出了一系列创新的方法,包括解决最大最小后悔值问题的算法、处理完全理性攻击者的可扩展算法,以及用于减少收益不确定性的无人机路径规划策略。
1. 无人机规划的启发式算法
为了减少收益的不确定性,我们提出了用于选择最佳无人机路径的启发式算法。由于保护区内移动传感器有限,无人机可定期收集精确图像以降低收益不确定性。因此,确定最佳无人机路径至关重要,能最大程度减少防御者的后悔值。
1.1 启发式算法流程
以下是无人机规划的通用启发流程(Algorithm 2):
Algorithm 2. Elicitation process
1 Input: budget: B, regret barrier: δ, uncertainty intervals: I;
2 Initialize regret r = +∞, cost c = 0 ;
3 while c < B and r > δ do
4
(r, x∗, (x′,∗, Ra,∗, Pa,∗)) = ARROW(I);
5
P = calculatePath(x∗, (x′,∗, Ra,∗, Pa,∗));
6
I = collectInformationUAV(P); c = updateCost(P);
7 return (r, x∗);
该算法的输入包括防御者的初始预算 $B$、后悔阈值 $\delta$ 和不确定性区间 $I$。在每次
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



