22、博弈论中的丰富表示与学习教学机制

博弈论中的丰富表示与学习教学机制

1. 丰富表示方法

在博弈论中,为了更有效地处理和表示复杂的博弈场景,出现了多种丰富的表示方法。

1.1 动作图博弈(AGG)
  • 效用函数表示 :效用函数集合 $u = {uα|α ∈A}$,其中 $uα : C(α) \to R$。由于每个效用函数仅从给定动作邻域的可能配置进行映射,所以可以简洁地表示。例如在道路博弈中,每个节点最多有四条入边,每个节点只需存储 $O(n^4)$ 个数字,整个博弈存储 $O(|A|n^4)$ 个数字。当动作图的入度受常数限制时,AGG 表示的空间复杂度是关于 $n$ 的多项式。
  • 表达能力 :与图形博弈一样,AGG 具有完全的表达能力。任意标准型博弈都可以用具有不重叠动作集的 AGG 表示,图形博弈也可以类似编码,但边结构更稀疏。
  • 扩展应用
    • 函数节点扩展 :可以扩展到包含函数节点,这些节点不对应动作,用于表示效用函数的中间参数,允许对具有额外独立结构的博弈进行紧凑表示。当具有函数节点的博弈中每个玩家独立影响配置 $c$ 时,仍可在多项式时间内计算期望效用。
    • 可加性扩展 :还能扩展以利用玩家效用函数的可加性,从而能够紧凑表示包括拥塞博弈在内的各种现实博弈。
1.2 多智能体影响图(MAIDs)
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值