UCT算法在多人游戏中的性能分析
1. 实验背景与设置
我们进行了一系列实验,旨在将UCT(Upper Confidence bounds applied to Trees)算法与先前的先进程序在三个不同领域的游戏中进行性能对比。这些实验涵盖了多种游戏类型,能让我们深入了解UCT在多人游戏中的实际表现。
大部分实验是在3人或4人游戏中,对两种不同类型的玩家(UCT玩家和现有玩家)进行的。为减少实验方差,针对游戏中玩家类型的每种可能排列,实验都会重复多次。例如,在3人游戏中,两种玩家类型有8种排列方式,去除两种全为单一类型玩家的排列后,得到如下6种配置:
| Player 1 | Player 2 | Player 3 |
| ---- | ---- | ---- |
| Type A | Type A | Type B |
| Type A | Type B | Type A |
| Type A | Type B | Type B |
| Type B | Type A | Type A |
| Type B | Type A | Type B |
| Type B | Type B | Type A |
2. 中国跳棋实验
- 游戏规则与实验设置 :中国跳棋的目标是尽快将棋子移动到与起始位置对称的区域。我们使用的棋盘比常见的略小,以便使用更强的评估函数。对手使用的maxn玩家评估函数基于一个查找表,该表包含在无其他玩家棋子的情况下,从任何状态到目标状态的最优距离。
- UCT策略与实验过程