Kaggle 模拟与优化竞赛全解析
1. 竞赛基础与示例
在竞赛中,一些基础逻辑块虽构建起来有些繁琐,但将直觉转化为启发式规则很有用,可用于竞赛代理。以新定义的代理为例,可与预定义代理(如随机代理)对比评估其性能,代码如下:
env.reset()
env.run([my_agent, "random"])
env.render(mode="ipython", width=500, height=450)
像 Connect X 这类相对简单的问题,甚至能用接近最先进的方法(如 AlphaZero)解决,相关链接:https://www.kaggle.com/connect4alphazero/alphazero-baseline-connectx 。
2. 石头剪刀布竞赛
石头剪刀布竞赛是基础游戏的扩展,采用“千局最佳”而非传统的“三局两胜”。解决该问题有两种方法:
- 博弈论方法 - 纳什均衡 :纳什均衡指在非合作博弈中,每个玩家知晓其他玩家的均衡策略,且仅改变自身策略无法获得优势。在石头剪刀布中,若双方以 1/3 的概率随机选择,即为纳什均衡。可构建如下简单代理:
%%writefile submission.py
import random
def nash_equilibrium_agent(observation, configuration):
return random.randint(0, 2)
超级会员免费看
订阅专栏 解锁全文
1657

被折叠的 条评论
为什么被折叠?



