人工智能在游戏领域的应用与案例剖析
1. TD - Gammon的卓越表现
TD - Gammon 3.0在西洋双陆棋领域展现出了惊人的实力。基于西洋双陆棋大师们的分析,它的棋力接近甚至可能超越了世界顶级人类棋手。后续的研究表明,TD - Gammon 3.1在棋子移动决策上具有“压倒性优势”,在加倍决策上也有“微弱优势”。
TD - Gammon对人类棋手的下棋方式产生了重大影响。例如,它在某些开局位置的下法与人类传统方式不同,如今顶级人类棋手也开始借鉴它的下法。受其启发的其他自学习人工神经网络西洋双陆棋程序,如Jellyfish、Snowie和GNUBackgammon的广泛应用,加速了新思维和新策略的传播,提升了人类比赛的整体水平。
2. 塞缪尔的跳棋程序
塞缪尔在1952年为IBM 701编写了第一个跳棋程序,1955年完成了学习程序,并在1956年进行了电视演示。他选择跳棋作为研究机器学习的领域,是因为跳棋相对简单,能让他更专注于学习过程。
塞缪尔的程序通过从当前位置进行前瞻性搜索来下棋。它使用启发式搜索方法来扩展搜索树和决定何时停止搜索,终端棋盘位置通过线性函数近似的价值函数进行评估。程序基于香农的极小化极大算法来找到最佳走法。
塞缪尔使用了两种主要的学习方法:
- 机械学习 :简单地保存每个遇到的棋盘位置及其通过极小化极大算法确定的备份值。这使得如果相同位置再次出现,搜索深度会有效增加。为了让程序有“方向感”,塞缪尔在极小化极大分析中每次将位置的值降低一小部分。机械学习带来了缓慢但持续的改进,尤其在开局和残局阶段效果显著。
-
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



