10、游戏策略的逻辑 - 自动机研究

游戏策略的逻辑 - 自动机研究

在当今社会,关于理性主体之间社交程序和交互的形式算法模型研究日益增多。当交互被建模为游戏时,推理就涉及到分析主体影响结果的长期能力,主体会制定各自的策略以确保最大收益。近年来,研究人员试图设计将策略作为“一等公民”的逻辑和模型,但目前仍存在许多有趣的问题,如玩家之间的沟通与协调,特别是在信息不完全的游戏中。本文将探讨游戏和多智能体系统中战略推理的逻辑和自动机理论模型。

1. 策略结构探索
1.1 未知玩家类型

设想你身处一个拥挤的房间,有超过50人参与一个游戏。你需要在0到100之间选一个实数,谁选的数最接近所有人所选数平均值的三分之二,谁就获胜。游戏理论建议选0,因为平均值的三分之二不会超过67,所以大于67的数可排除;同理,后续大于44等的数也可排除。但实际游戏中,获胜的数通常在20左右。这一现象常被用来质疑博弈论中“理性的共同知识”这一标准假设。我们考虑这个游戏的目的,是想指出游戏中的策略制定与对(最优)策略存在性的推理不同。实际采用的策略具有相当的结构,它们往往是启发式的、部分的,基于对其他玩家类型的考虑,会随时间演变,并且常由在其他游戏情境中有效的部分策略组合而成。

1.2 尼姆游戏

尼姆游戏从m堆计数器开始,两名玩家轮流选择一堆并从中移除非零数量的计数器,无移动可选的玩家输。该游戏由Bouton在1902年提出并完全解决,它是一个双方有相同移动集的两人零和完全信息游戏,且所有此类游戏都可归结为尼姆游戏。

在尼姆游戏中,(1, 1)是必输局面,因为无论你减少哪一堆,对手都能让你无移动可选;(2, 2)同样是必输局面,对手可复制你的操作。一般来说,尼姆局面(m, n)中,当

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值