空间量子博弈模拟:三参数策略与马林纳托 - 韦伯模型
1. 三参数策略概述
在三参数(3P)策略中,玩家遵循一般的 SU(2) 策略,U 结构中的 β 参数处于活跃状态。这种策略下的博弈模拟呈现出与双参数(2P)策略不同的特点。
2. 3P - QPD 模拟
在 3P - QPD 模拟中,收益结构与 2P - QPD 明显不同。3P 模拟中没有不连续性,且无论纠缠因子 γ 如何,双方玩家的收益都一致。参数图有两个主要特征:
- θ 参数趋向于 π,使得 α 的值变得无关紧要。
- β 参数接近 π/4 振荡。
在平均场方法中,双方玩家会采用策略 ˆX = U(π, α, π/4) =
[
\begin{pmatrix}
0 & e^{i\pi/4} \
-e^{-i\pi/4} & 0
\end{pmatrix}
]
当 γ 低于阈值 γ # = arcsin (\sqrt{\frac{P - S}{T + P - R - S}} = \frac{1}{3}) = 0.615 时,策略对 ( ˆX, ˆX) 处于纳什均衡(NE)。γ # 是 θ 参数不稳定出现的标志,表现为平均场收益的不稳定和实际收益标准差的非零值上升。但强大的空间效应似乎能补偿这些波动,使 ( ˆX, ˆX) 大致主导局面。实际平均收益根据方程 p = P + (R - P) sin²γ = 2 + sin²γ 随 γ 的变化而增加。
3. 3P - QHD 模拟
在 3P - QHD(3,2,0, - 1) 模拟中,收益图在阈值
超级会员免费看
订阅专栏 解锁全文
55

被折叠的 条评论
为什么被折叠?



