利用深度神经网络确定围棋玩家技能
1. 引言
计算机围棋主要聚焦于开发下棋程序。而本文致力于运用深度神经网络分析现有围棋游戏记录,旨在改进在线围棋服务器的排名系统,让服务器为用户匹配更合适的对手,提升用户游戏体验。
深度神经网络如今是热门研究领域,极大地改变了计算机视觉和自然语言处理等难题领域。数据的丰富、强大计算能力的图形处理单元(GPU)以及智能模型,推动了深度架构的蓬勃发展。由于这三个因素都有很大的提升空间,预计这类模型会越来越多。
围棋是双人全信息棋盘游戏,通常在 19×19 的方格棋盘上用黑白棋子对弈,目标是通过围地和提掉对方棋子控制棋盘。围棋一直是人工智能的优质测试场,此前被认为极具挑战性,直到谷歌的 AlphaGo 击败世界顶级职业棋手李世石,令众多计算机围棋研究者大为震惊。
在围棋里,业余棋手的实力用级(学生)和段(大师)来衡量。级从 25 级(绝对新手)递减到 1 级(较强棋手),段从 1 段(比 1 级稍强)到 6 段(非常强的棋手)。通常,这些等级用一个连续的量——评级来建模。
评级系统用于数值化表达棋手实力。在线围棋服务器需要它来为用户匹配实力相近的对手以及比较用户技能。常用的数学模型有 ELO 或贝叶斯方法。每场比赛后,这些系统根据比赛结果(胜/负/平)修改用户评级。由于围棋平局极少,每场比赛提供的信息略多于 1 比特。因此,当前系统需要大量比赛才能收敛到棋手的真实评级,给新玩家带来困扰,常让他们与实力不匹配的对手对战。
比如,AlphaGo 与李世石比赛后,在线围棋服务器(OGS)涌入大量新手,他们常选错初始等级,给管理员带来困扰。此外,一些实际实力远超所报等级的玩家也会给同等级较弱玩家带来困
超级会员免费看
订阅专栏 解锁全文
28

被折叠的 条评论
为什么被折叠?



