2、围棋:作为机器学习问题的深入剖析

围棋:作为机器学习问题的深入剖析

1. 为何选择游戏进行人工智能研究

游戏一直是人工智能研究的热门主题,这不仅仅是因为它们有趣,更重要的是,游戏简化了现实生活中的一些复杂性,使研究者能够专注于所研究的算法。

以社交媒体上的评论为例,当我们看到“哎呀,我忘了带伞”这样的评论时,能迅速推断出朋友遇到了下雨的情况。这是因为我们在阅读时自然地运用了关于雨伞用途的常识,以及人们发表评论的社交知识。然而,计算机在处理这类需要上下文信息的任务时却面临困难。现代深度学习技术虽然能有效处理输入的信息,但我们很难找到所有相关信息并将其提供给计算机。而游戏则避免了这个问题,它们在一个规则明确的人造环境中进行,做出决策所需的所有信息都包含在规则里。

游戏尤其适合强化学习。强化学习需要反复运行程序并评估其完成任务的效果。例如,使用强化学习训练机器人在建筑物内移动时,在控制系统未精确调整之前,机器人可能会摔倒或撞倒家具。虽然可以构建计算机模拟环境来避免这些风险,但这不仅需要投入大量精力开发详细的模拟程序,而且模拟结果可能并不完全准确。相比之下,让人工智能玩游戏则简单得多。即使在学习过程中输掉数十万场比赛也无关紧要。许多前沿算法最初都是在Atari等视频游戏中得到验证的。

2. 围棋规则速览

要理解围棋与机器学习的结合,首先需要了解围棋的基本规则。围棋规则简单,两名玩家轮流在棋盘上放置黑子和白子,黑方先下,目标是用自己的棋子控制尽可能多的棋盘区域。

2.1 棋盘理解

围棋棋盘是一个方形网格,棋子放置在交叉点上,而非方格内。标准棋盘为19×19,但玩家有时也会使用9×9或13×13的小棋盘进行快速对局。棋盘上有九个标记点,称

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值