20、基于深度学习的对手模型选择

基于深度学习的对手模型选择

在计算机游戏领域,准确预测对手的实力是提升程序表现的关键技术之一。本文将聚焦于中国暗棋这一游戏,探讨如何利用深度学习来选择合适的对手模型,以提高程序在比赛中的排名。

1. 引言

在计算机游戏中,许多游戏程序在面对不同风格的对手时,实力表现会有很大差异。为了在与不同程序对战时调整策略,获得最佳结果,准确估计对手的实力至关重要。

在国际象棋等游戏中,有一种策略叫做“蔑视因子”,它表示两个程序之间的实力差异。当蔑视因子非负时,意味着对手实力与我们相当或更强,此时即使我们有小优势,也可接受平局;当蔑视因子为负时,对手实力较弱,我们即使有小劣势也不接受平局。

在计算机游戏锦标赛中,有老选手和新选手。对于老选手,我们可以根据以往成绩估计其实力;对于新选手,需要设计方法来预测他们的实力。在中国暗棋中,了解对手实力很重要,因为我们可以根据对手强弱做出不同决策,比如对手弱时牺牲高价值棋子来获胜。而且,中国暗棋容易出现平局,通过小兵追将就能实现,同时它也是非确定性游戏,翻开暗棋可能使局势逆转。

本文提出通过将游戏的前20步棋输入深度学习神经网络模型来估计对手程序的实力,实验结果表明该方法能提高程序在比赛中的预期得分。

2. 背景知识
2.1 术语解释
  • 棋盘位置(b) :表示游戏的状态。
  • 合法走法(p) :能将当前棋盘位置转换为下一个棋盘位置的动作,即T(b, p) = b′,其中b′是走法p应用于棋盘位置b后的棋盘位置。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值