
Alpha Zero
文章平均质量分 71
lawme
这个作者很懒,什么都没留下…
展开
-
Alpha Zero 趣味学习:TicTacToe
Alpha Zero 趣味学习:TicTacToe深度学习风行天下的起始,是围棋软件 AlphaGo 的成功。从游戏软件开发中学习 deep learning,可以适当避开深度学习理论的繁难晦涩、枯燥乏味,值得一试。AlphaGo 有着名垂青史的赫赫功绩,但也有其难免的弱点。它的学习方法属于有监督学习,需要海量标注数据,不仅使得开发成本居高,并且学习者难有充足数据可用。AlphaG...原创 2018-09-05 00:45:32 · 631 阅读 · 0 评论 -
Alpha Zero 趣味学习:设置网络参数
Alpha Zero 趣味学习:设置网络参数原创 2018-09-06 08:49:35 · 1093 阅读 · 0 评论 -
Alpha Zero 趣味学习:训练网络
启动 TicTacToe ,会进入网络训练或人机对弈。如果不设置启动参数 –human_play=1,便自动进入网络训练。即:python main.py开始训练前,要在 main.py 中做两件事情。第一,初始化游戏和网络:if CFG.game == 0: game = TicTacToeGame()net = NeuralNetworkWrapper(game)...原创 2018-09-07 16:19:10 · 834 阅读 · 0 评论 -
『深度學習與圍棋遊戲』筆記 1
最近,搞到一本書 Deep Learning and the Game of Go 。歐美書商好像有種習慣,科技方面尤其編程相關的電子書,銷售一段時間後會公開放到網上,供人免費下載。這本書就來源於此。估計,有社會資本支持書商的善舉。希望國內資本雄厚的企業,向西方學習,鼓勵支持國內書商也這樣做。這本書分為3篇14章及5個附錄。第一篇:基礎第1章, 簡明扼要地介紹人工智能、機器學習、深度學習...翻译 2019-04-11 06:22:56 · 663 阅读 · 0 评论 -
『深度學習與圍棋遊戲』筆記 2
教機器學習的內容佈局模型庫。由高手佈局棋譜中的高頻率走步構成。建立棋局狀態搜索樹。盡量減少備先的下一步棋。估算每步棋的價值。衡量機器人的棋力傳統的日本級段制。與機器人或者人類比賽測定。建造第一個機器人...翻译 2019-04-16 10:34:33 · 518 阅读 · 0 评论