多智能体系统中的战略推理逻辑
1 引言
在多智能体系统的研究中,逻辑与博弈论的结合为我们理解智能体之间的交互和战略决策提供了强大的工具。本文将介绍几种重要的逻辑,包括效应函数、联盟逻辑(Coalition Logic)、交替时间时态逻辑(Alternating - time Temporal Logic,ATL)以及考虑不完美信息的战略推理逻辑,探讨它们在多智能体系统中的应用和特点。
2 效应函数
效应函数用于描述一组玩家在一组状态上的有效性。对于一组玩家 $Agt$ 和一组状态 $St$,效应函数 $E$ 定义为:
$E : 2^{Agt} \to 2^{2^{St}}$
它为每个联盟 $C$ 给出了其有效的结果集 $E(C)$。博弈框架 $G$ 会诱导出一个相关的效应函数 $E_G$,其定义如下:
$X \in E_G(C) \Leftrightarrow \exists \sigma_C \in \Sigma_C \forall \sigma_{Agt\setminus C} \in \Sigma_{Agt\setminus C}. o(\sigma_C, \sigma_{Agt\setminus C}) \in X$
这种从博弈框架诱导出的效应函数在社会选择理论中被称为 $\alpha$ - 效应函数。
3 联盟逻辑
联盟逻辑(CL)是一种模态逻辑,用于形式化关于联盟能力的推理。它扩展了命题逻辑,为每个联盟 $C$ 引入了模态词 $[C]$。$[C]\phi$ 的预期含义是联盟 $C$ 可以使博弈的结果满足 $\phi$。
超级会员免费看
订阅专栏 解锁全文
1146

被折叠的 条评论
为什么被折叠?



