18、经典关联博弈的模拟研究

经典关联博弈的模拟研究

1. 经典关联的构建

有一种构建非可分解联合概率矩阵 Π 的方法,它从可分解的 Π 出发。在可分解的 Π 中,元素关系为:π11 = xy,π12 = x - π11,π21 = y - π11,π22 = 1 + π11 - (x + y)。此时,仅改变 π11 = xy 的形式,同时保持 Π 其他三个元素作为 π11 的函数形式不变。要确保 Π 的所有元素都在 [0, 1] 区间且总和为 1.0,对 π11(x, y) 的唯一限制是 π11(x, y) < xy 。例如,有人提出 π11 = (xy)² 和 π11 = x²y³ 。

然而,π11(x, y) < xy 并不足以保证 π22 = 1 + π11 - (x + y) 为非负。以 x = y 为例,即 π22 = 1 + π11 - 2x :
- 当 π11 = x⁴ 时,若 0.554 < x < 1.0,π22 为负。
- 当 π11 = x⁵ 时,若 0.519 < x < 1.0,π22 为负。

2. 空间博弈

2.1 基本规则

在空间博弈场景中,每个玩家 (i, j) 会确定性地模仿其邻居中收益最高的伙伴 (k, l) 的概率策略。初始时,(x, y) 概率值是从 [0, 1] 区间的均匀分布中随机抽取的,所以初始时 x ≃ 0.5 且 y ≃ 0.5 。

2.2 囚徒困境(PD)

以 PD(5, 3, 2, 1) 游戏为例,初始时除了位于 (3, 4) 单元格的背叛者玩家 A(x = 0),其他玩家都选择合作(x = y = 1)。在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值