1、单人蒙特卡罗树搜索:SameGame难题的新解决方案

单人蒙特卡罗树搜索:SameGame难题的新解决方案

一、引言

近年来,蒙特卡罗(MC)方法在游戏智能玩法中成为一种流行的方法。最初,MC模拟被用作经典搜索树中的评估函数,应用于西洋双陆棋、Clobber和幻影围棋等游戏。但由于评估成本高,在某些游戏中搜索无法足够深入地探索搜索树。

随后,MC模拟以多种方式被融入树搜索,形成了蒙特卡罗树搜索(MCTS)方法。这是一种最佳优先搜索,MC模拟引导搜索过程。特别是在搜索空间巨大的围棋游戏中,MCTS方法取得了成功。

然而,MCTS在单人游戏中应用较少。目前已知的例子是帆船领域,应用于具有不确定性的游戏。对于具有完美信息的单人游戏(即谜题),MCTS尚未得到应用。传统解决谜题的方法是A 和IDA ,它们在解决谜题方面相当成功,但缺点是需要一个可接受的启发式评估函数,而构建这样的函数可能很困难。由于MCTS不需要可接受的启发式,它可能是一个有趣的替代方案。本文将研究MCTS在谜题SameGame中的应用,并提出一种新的MCTS变体——单人蒙特卡罗树搜索(SP - MCTS)。

二、SameGame游戏介绍
(一)背景

SameGame由Kuniaki Moribe于1985年以“Chain Shot!”的名称发明,最初在Fujitsu FM - 8/7系列的月度个人电脑杂志《Gekkan ASCII》上发布。1992年,Eiji Fukumoto将其重新创作并命名为SameGame。目前,Billings开发的程序在SameGame中表现最佳。

通过随机玩106个谜题,估计游戏的平均长度为64.4步,平均分支因子为20.7,游戏树复

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值