围棋:作为机器学习问题的深入剖析
1. 为何选择游戏进行人工智能研究
游戏一直是人工智能研究的热门主题,这不仅仅是因为它们有趣,更重要的是,游戏简化了现实生活中的一些复杂性,使研究者能够专注于所研究的算法。
以社交媒体上的评论为例,当我们看到“哎呀,我忘了带伞”这样的评论时,能迅速推断出朋友遇到了下雨的情况。这是因为我们在阅读时自然地运用了关于雨伞用途的常识,以及人们发表评论的社交知识。然而,计算机在处理这类需要上下文信息的任务时却面临困难。现代深度学习技术虽然能有效处理输入的信息,但我们很难找到所有相关信息并将其提供给计算机。而游戏则避免了这个问题,它们在一个规则明确的人造环境中进行,做出决策所需的所有信息都包含在规则里。
游戏尤其适合强化学习。强化学习需要反复运行程序并评估其完成任务的效果。例如,使用强化学习训练机器人在建筑物内移动时,在控制系统未精确调整之前,机器人可能会摔倒或撞倒家具。虽然可以构建计算机模拟环境来避免这些风险,但这不仅需要投入大量精力开发详细的模拟程序,而且模拟结果可能并不完全准确。相比之下,让人工智能玩游戏则简单得多。即使在学习过程中输掉数十万场比赛也无关紧要。许多前沿算法最初都是在Atari等视频游戏中得到验证的。
2. 围棋规则速览
要理解围棋与机器学习的结合,首先需要了解围棋的基本规则。围棋规则简单,两名玩家轮流在棋盘上放置黑子和白子,黑方先下,目标是用自己的棋子控制尽可能多的棋盘区域。
2.1 棋盘理解
围棋棋盘是一个方形网格,棋子放置在交叉点上,而非方格内。标准棋盘为19×19,但玩家有时也会使用9×9或13×13的小棋盘进行快速对局。棋盘上有九个标记点,称
超级会员免费看
订阅专栏 解锁全文
2526

被折叠的 条评论
为什么被折叠?



