量子囚徒困境中的概率更新研究
1. 概率更新中的参数稳定情况
在概率更新过程中,β 参数无论 γ 取值如何,都会稳定在 π/4 附近。而从 γ ≃ π/8 开始,两种类型的 θ 参数会稳定在 π 附近,此时 α 参数变得无关紧要。
在 CA 模拟中,图 6.15 的 (5,1) 框架下实际收益的一般形式,是图 6.16 右框架形式的一种(非常)变形修改。图 6.16 右框架在 γ = π/4 时实现收益均衡,而图 6.15 则在高 γ 值时实现。
2. 具有概率更新的量子囚徒困境(QPD)
2.1 不公平 QPD 竞赛
2.1.1 两参数情况
图 6.17 展示了不公平量子两参数 PD(5,3,2,1) PCA 在不同纠缠因子 γ 下的五次模拟的渐近收益。纠缠因子取值不同时,收益表现如下:
- 低 γ 值时,渐近收益维持惩罚值 P = 2。
- γ > π/4 时,量子玩家(红色标记)的收益超过经典玩家(蓝色标记)。
- 在 (γ ∗, γ •) = (0.524, π/4) 区间内,情况出乎意料,经典玩家的收益超过量子玩家。在 γ ∗ = 0.524 之后出现的峰值极为惊人。随着 γ 从该值增加到 γ • = π/4,收益顺序的反转逐渐减弱,到 γ • = π/4 时,两者达到相同的 p 值,即奖励 R = 3。
- γ • 值之后,预期的收益顺序逐渐显现,在 γ = [(π/4 + 3π/8)] / 2 之后会出现一种嘈杂的行为。这种不连续性不仅打破了量子玩家收益高于经典玩家的趋势,还使得五次不同模拟的差异变得明显。
图 6.18 展示了图
超级会员免费看
订阅专栏 解锁全文
870

被折叠的 条评论
为什么被折叠?



