基于深度学习的对手模型选择
在计算机游戏领域,准确预测对手的实力是提升程序表现的关键技术之一。本文将聚焦于中国暗棋这一游戏,探讨如何利用深度学习来选择合适的对手模型,以提高程序在比赛中的排名。
1. 引言
在计算机游戏中,许多游戏程序在面对不同风格的对手时,实力表现会有很大差异。为了在与不同程序对战时调整策略,获得最佳结果,准确估计对手的实力至关重要。
在国际象棋等游戏中,有一种策略叫做“蔑视因子”,它表示两个程序之间的实力差异。当蔑视因子非负时,意味着对手实力与我们相当或更强,此时即使我们有小优势,也可接受平局;当蔑视因子为负时,对手实力较弱,我们即使有小劣势也不接受平局。
在计算机游戏锦标赛中,有老选手和新选手。对于老选手,我们可以根据以往成绩估计其实力;对于新选手,需要设计方法来预测他们的实力。在中国暗棋中,了解对手实力很重要,因为我们可以根据对手强弱做出不同决策,比如对手弱时牺牲高价值棋子来获胜。而且,中国暗棋容易出现平局,通过小兵追将就能实现,同时它也是非确定性游戏,翻开暗棋可能使局势逆转。
本文提出通过将游戏的前20步棋输入深度学习神经网络模型来估计对手程序的实力,实验结果表明该方法能提高程序在比赛中的预期得分。
2. 背景知识
2.1 术语解释
- 棋盘位置(b) :表示游戏的状态。
- 合法走法(p) :能将当前棋盘位置转换为下一个棋盘位置的动作,即T(b, p) = b′,其中b′是走法p应用于棋盘位置b后的棋盘位置。
超级会员免费看
订阅专栏 解锁全文
7178

被折叠的 条评论
为什么被折叠?



