2、将围棋视为机器学习问题:解锁智能博弈的奥秘

将围棋视为机器学习问题:解锁智能博弈的奥秘

1. 为何选择游戏作为 AI 研究对象

游戏一直是 AI 研究的热门主题,这不仅仅是因为它们有趣,更重要的是,游戏简化了现实生活中的一些复杂性,让研究者能够专注于所研究的算法。

以社交媒体上的一条评论“哎呀,我忘了带伞”为例,人类能够轻松推断出朋友遇到了下雨的情况。这是因为我们运用了关于雨伞用途的常识,以及人们发表评论的社交知识。然而,计算机在处理这类隐含信息时却面临困难。现代深度学习技术虽然能够有效地处理输入的信息,但我们很难找到所有相关信息并将其提供给计算机。

游戏则巧妙地避开了这个问题。它们发生在一个人造的环境中,所有决策所需的信息都在规则中明确列出。此外,游戏特别适合强化学习。例如,使用强化学习训练机器人在建筑物中移动时,在控制系统未完全调试好之前,机器人可能会摔倒或撞倒家具。虽然可以构建计算机模拟环境,但这不仅需要投入大量精力开发详细的模拟程序,而且模拟结果可能并不完全准确。而对于游戏来说,只需要让 AI 进行游戏即可。即使在学习过程中输掉几十万场比赛也无关紧要。许多前沿算法最初都是在 Atari 视频游戏(如《打砖块》)中得到验证的。

2. 围棋规则快速入门
  • 棋盘理解 :围棋棋盘是一个方形网格,棋子放置在交叉点上,而非方格内。标准棋盘为 19×19,但玩家有时也会使用 9×9 或 13×13 的小棋盘进行快速对局。棋盘上有九个标记为点的位置,称为星位,主要用于帮助玩家判断距离,对游戏规则没有影响。
  • 落子与提子 :两名玩家分别使用黑子和白子,轮流在棋盘上落子,黑方先行。棋
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值