AlphaGo系列整理
文章平均质量分 80
Andromeda_J
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
揭开AlphaGo不再神秘的面纱
AlphaGo战胜人类职业围棋选手李世石已经是2016年的事儿了,而现在是2018年2月,这则轰动一时的新闻让更多的普通人见识到人工智能的潜力。自那以后,无数业界大神对AlphaGo进行了各个角度的剖析和解读,2017年10月,AlphaGo Zero的问世更使AlphaGo变得不再新鲜和神秘。受一篇大神文章的启迪,今天我也来揭一揭这块不再神秘的面纱,也算是对自己过去一周学习的总结和整理。读者放心...原创 2018-02-10 10:11:15 · 707 阅读 · 0 评论 -
大道至简——AlphaGo Zero的减法生存
AlphaGo主要包括四个部分:策略网络、价值网络、快速走子网络、蒙特卡罗树搜索,其中包含三个神经网络需要KGS专家棋谱数据集和数月训练时间。AlphaGo Zero在上述基础上降低神经网络结构复杂性,将原先两个独立结构的策略网络和价值网络合为一体并舍弃了快速走子网络,形成一个共享神经网络,在该共享神经网络中,从输入层到中间层的权重是完全共享的,最后的输出阶段分为策略函数输出和价值函数输出。此外,...原创 2018-02-26 11:40:31 · 1079 阅读 · 0 评论
分享