量子博弈中的不公平竞争、策略更新与网络模拟
1. 不公平竞争与策略更新
1.1 不公平竞赛
在某些不公平的量子匹配硬币(MP)游戏模拟中,当经典玩家 B 无法使用(α, β)参数时,玩家 A 和 B 的实际平均收益无论纠缠度 γ 如何,都接近零,玩家 A 略正,玩家 B 略负。例如在 γ = π/2 时,pA = 0.036,pB = -0.036。这表明(θ, α, β)-量子玩家在面对(θ)-经典玩家时,在 MP 游戏中没有显著优势。
而当(θ, α, β)-量子玩家面对无法使用 θ 参数的玩家时,前者在 MP 游戏中具有完全优势。例如当 θB = 0.0 时,收益图与特定情况的图相似,平均参数也有相应特点。
1.2 不公平策略更新
在模拟中,只有一种玩家类型更新策略,另一种玩家类型保持其初始的空间量子参数分配。这种不公平更新主要在匹配硬币游戏和囚徒困境的最佳响应策略研究中进行探讨。
在 2P - QMP 不公平策略模拟中,当 θA = θB = π/2,αA = αB = π/4 时,平均场方法与之前的模拟一致,但实际平均收益不同。当只有玩家 A 更新策略时,玩家 A 高估玩家 B;当只有玩家 B 更新策略时,玩家 B 高估玩家 A,但程度低于前者。
在 3P - MP 空间模拟中,只有玩家 A 类型更新策略时,玩家 A 的实际平均收益大于玩家 B,且随着 γ 增加,pA 增加,pB 减少。例如在 γ = 0.0 时,pA = 0.201,pB = -0.201;在 γ = π/2 时,pA = 0.424,pB = -0.424。
在 2P - QPD(5, 3,
超级会员免费看
订阅专栏 解锁全文
38

被折叠的 条评论
为什么被折叠?



