
围棋与深度学习
文章平均质量分 85
先翻译deep learning and the game of go,然后跟着作者一步一步地去实践
idol_watch
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
翻译Deep Learning and the Game of Go(13)第十一章 用价值网络进行强化学习
本章包括利用Q-learning算法制作一个自我提升的游戏AI 利用Keras定义和训练多输入神经网络 使用Keras构建和训练Q-learning AI你读过关于国际象棋或围棋高级比赛的专家评论吗?你会经常看到这样的评论:“黑棋在这一点上远远落后”或者“”到这里为止白棋结果略好一些"。在这样一个战略游戏中,“领先”或“落后”意味着什么?这不是篮球,有一个正在进行的分数可以参考。在围棋游...原创 2020-05-12 11:14:37 · 1037 阅读 · 0 评论 -
翻译Deep Learning and the Game of Go(12)第十章:利用策略梯度进行强化学习
本章介绍利用策略梯度学习来提升游戏对弈水平 使用Keras实现策略梯度学习 为策略梯度学习改变优化器第9章向您展示了如何让一个下围棋的程序和自己对弈,并把结果保存在经验数据中这是强化学习的前半部分;下一步是运用经验数据来提升代理水平,以便让它可以更经常地获胜。来自上一章的代理使用神经网络来选择落子。作为一个思维实验,想象一下你随机改变神经网络的每个权重,然后代理将选择不同的落子。只要运...原创 2020-05-12 11:14:01 · 730 阅读 · 0 评论 -
翻译Deep Learning and the Game of Go(10)第八章:部署你的AI
本章包括:构建一个端到端的应用程序来训练和运行一个围棋机器人 在前端运行来对抗你的机器人 让你的机器人在本地与其他机器人对抗。 部署到在线围棋服务器到目前为止,你已经知道如何为围棋落子预测去构建和训练一个强大的深度学习模型,但是你如何将它集成到一个与对手玩游戏的应用程序中?训练神经网络工作只是构建端到端应用程序的一部分,不管你是自我对弈,还是让你的机器人与其他机器人竞争,这个模型必须集...原创 2020-05-12 11:12:56 · 858 阅读 · 0 评论 -
翻译Deep Learning and the Game of Go(15)第13章 AlphaGo:把这一切都汇集在一起
第三部分 大于部分之和 此时,您已经学习了许多人工智能技术,这些技术来自经典的树搜索、机器学习和强化学习。每一个都是强大的,但每一个都有局限性。要做一个真正强大的围棋AI,你需要结合你到目前为止学到的一切。整合所有这些部件是一项严肃的工程壮举。这一部分涵盖了AlphaGo的体系结构,这个AI震撼了围棋世界-还有AI世界!这本书结束之前,你将了解到AlphaGo Zero的优雅的简...原创 2020-05-12 11:14:51 · 1437 阅读 · 2 评论 -
翻译Deep Learning and the Game of Go(10)第七章:从数据中学习:一个深度学习AI
本章包括下载和处理实际的围棋游戏记录 了解存储围棋游戏的标准格式 训练一个使用这样的数据进行落子预测的深度学习模型 运行自己的实验并评估它们在前一章中,您看到了构建深度学习应用程序的许多基本要素,并构建了一些神经网络来测试您所学到的工具。而关键的是你仍然缺少好的数据来学习。一个监督式的深度神经网络需要你提高好的数据——但目前为止,你只拥有自己生成的数据。在这一章中,您将了解围棋数据...原创 2020-03-10 15:17:10 · 1526 阅读 · 1 评论 -
翻译Deep Learning and the Game of Go(14)第十二章 采用actor-critic方法的强化学习
本章包括:利用优势使强化学习更有效率 用actor-critic方法来实现自我提升AI 设计和训练Keras的多输出神经网络如果你正在学习下围棋,最好的改进方法之一是让一个水平更高的棋手给你复盘。有时候,最有用的反馈只是指出你在哪里赢棋或输棋。复盘的人可能会给出这样的评论,“你下了30步后已经远远落后了”或“在下了110步后,你有一个获胜的局面,但你的对手在130时扭转了局面。”为什...原创 2020-05-12 11:14:24 · 927 阅读 · 0 评论 -
翻译Deep Learning and the Game of Go(11)第九章:靠实践学习:强化学习
本章包括:为强化学习定义一个任务 为游戏构建一个学习代理 为训练收集自我游戏经验我可能已经读过十几本关于围棋的书,这些书都是由来自中国、韩国和日本的强大专业人士写的,但我依旧只是一个中等的业余棋手。为什么我没有达到和这些传奇一样的水平呢?是因为我忘记他们的课程吗?不是这样的;我实际上可以背诵Toshiro Kageyama对于围棋基础的一些经验,也许我只需要读更多的书.。我不知道成为...原创 2020-05-12 11:13:42 · 1013 阅读 · 0 评论 -
翻译Deep Learning and the Game of Go(9)第六章:给围棋数据设计神经网络(下)
6.4.使用卷积网络对空间进行分析在围棋中,你经常会看到一些特定的局部棋形。人类玩家已经学会识别几十种棋形,并经常给它们起一些令人回味的名字(比如老虎口,双关,或我个人最喜欢的,花六)。要像人类一样做出决定,我们的围棋A I还必须认识到许多的局部棋形。现在有一种特殊类型的神经网络,称为卷积网络,它是专门为检测像这样的空间形状而设计的。卷积神经网络(CNNs)有很多游戏以外的应用:你会发现它们被...原创 2020-05-12 11:12:20 · 1167 阅读 · 0 评论 -
翻译Deep Learning and the Game of Go(8)第六章:给围棋数据设计神经网络(上)
本章包括(篇幅关系,本文章介绍前两个,后两个放在下个文章)构建一个深度学习应用程序从数据出发来预测下一步的围棋落子点 引入Keras深度学习框架 了解卷积神经网络 构建分析空间围棋数据的神经网络在前一章中,您看到了神经网络在行动中的基本原理,并从零开始实现了前馈网络。在本章中,你将把注意力转回到围棋游戏,并可以解决如何使用深度学习技术来预测在给定任何围棋盘面的情况下的下一步落子的问题。...原创 2020-02-28 09:19:30 · 1578 阅读 · 5 评论 -
翻译Deep Learning and the Game of Go(7)开始使用神经网络
这一章包括介绍了人工神经网络的基本原理 讲授一种识别手写数字的网络 通过堆叠层来创建神经网络 从数据中学习从而实现一个简单的神经网络本章介绍了人工神经网络(ANN)的核心概念,它是现代深度学习的核心算法。令人惊讶的是,人工神经网络的历史可以追溯到20世纪40年代初。耗费了几十年时间,它的应用程序才在许多领域取得巨大成功,但其基本思想仍然有效。人工神经网络的核心是从神经科学中获得灵感...原创 2020-04-03 08:09:50 · 1066 阅读 · 1 评论 -
翻译Deep Learning and the Game of Go(6)第4章(下)蒙特卡洛树搜索在围棋上的使用,改进评估函数
注:该文章接上一篇文章,同样是原书第4章内容4.5 使用蒙特卡洛树搜索来评估棋盘状态 在alpha-Beta剪枝中,你使用了一个盘面评估函数来帮助你减少必须考虑的盘面数量。但是围棋中的盘面评估是非常,非常困难的:你的基于吃子的简单评估函数不会愚弄很多围棋玩家。蒙特卡洛树搜索提供了一种在没有任何关于游戏的战略知识的情况下评估游戏状态的方法,该蒙特卡洛算法通过模拟随机游戏来评估...原创 2020-02-28 09:16:40 · 2121 阅读 · 3 评论 -
翻译Deep Learning and the Game of Go(5)第4章:使用树搜索来玩游戏(上)极小极大、深度剪枝、alpha-beta算法在围棋上的应用
第二部分 机器学习和游戏AI在第二部分中,您将学习经典游戏AI和现代游戏AI的组件。您将从各种树搜索算法开始,这些算法是做游戏AI和优化各种问题必不可少的工具。接下来,您将了解深度学习和神经网络,从数学基础开始,并进行许多实际的设计考虑。最后,你会得到一个关于强化学习框架的介绍,这是让你的游戏AI能够通过练习提升的框架。当然,这些技术不只是用在游戏上,一旦你掌握了这些组件,你将有机会将它...原创 2020-01-14 19:35:44 · 1706 阅读 · 6 评论 -
翻译Deep Learning and the Game of Go(5)第3章:实现你第一个围棋AI(下)
3.4 创建你第一个AI:可以想见的最弱AI在实现了围棋棋盘和游戏状态类之后,您可以构建您的第一个围棋AI。这个机器人将是一个很弱的玩家,但它将为你的后续所有改进奠定基础。首先,您需要定义所有机器人都要调用的接口,并把定义放入agent文件下中的base.py中。class Agent: def __init__(self): pass # 根据棋盘盘面...原创 2020-01-13 17:49:04 · 1382 阅读 · 3 评论 -
翻译Deep Learning and the Game of Go(4)第3章:实现你第一个围棋AI(上)
本章涵盖使用Python实现一个围棋棋盘 落子并模拟一个游戏 依据围棋规则来编程确保合法落子 构建一个可以自我对弈的简单机器人 可以与您的AI下完整的一盘棋在本章中,您将构建一个灵活的库,该库提供表示围棋游戏和支持围棋规则算法的数据结构。如上一章所述,围棋规则非常简单,但是要在计算机上实现它们,您必须仔细考虑所有边缘情况。如果您是围棋游戏的新...原创 2020-01-12 18:24:52 · 1877 阅读 · 0 评论 -
翻译Deep Learning and the Game of Go(3)第2章:围棋是一个机器学习难题(规则部分就不翻了)
本章涵盖为什么游戏是AI的好项目? 为什么围棋是深度学习的难题? 围棋的规则是什么? 您可以通过机器学习解决游戏的哪些方面? 2.1 为什么要用游戏?游戏是AI研究中最喜欢的主题,而不仅仅是因为它们很有趣。它们还简化了现实生活中的某些复杂性,因此您可以专注于正在研究的算法。想象一下,您在Twitter或Faceboo...原创 2020-01-11 10:47:40 · 2969 阅读 · 0 评论 -
翻译Deep Learning and the Game of Go(2)第1章:面向深度学习
第1章:面向深度学习本章内容包括:机器学习及其与传统编程的区别 机器学习无法解决的问题 机器学习与人工智能的关系 机器学习系统的结构 机器学习学科 只要存在计算机,程序员就对人工智能(AI)感兴趣:在计算机上实现类似人的行为。长期以来,游戏一直是AI研究人员的热门话题。在个人计算机时代,人工智能在跳棋,西洋双陆棋...原创 2020-01-10 19:16:47 · 1187 阅读 · 0 评论 -
翻译Deep Learning and the Game of Go(1)绪论部分
关于这本书这本书旨在通过一个实用而有趣的例子来引入机器学习:构建一个围棋人工智能。到第三章结束,你将能做出一个可以运行的围棋程序,即使它还比较弱。从第三章结束开始,之后的每一章都会介绍新的方法去改进你的AI, 你可以通过实验学习到每种技术的优点和缺点,到最后一章时,你的AI会达到最强,在那一章我们会展示AlphaGo和AlphaGo Zero是如何将所有技术整合到一起变成不可思议的强大AI谁应...原创 2020-01-10 15:54:21 · 1541 阅读 · 1 评论