梁敬彬梁敬弘兄弟出品
往期回顾
小朋友都能懂的人工智能⓵开篇大吉(上)
小朋友都能懂的人工智能⓵开篇大吉(中)
小朋友都能懂的人工智能⓵开篇大吉(下)
小朋友都能懂的人工智能②卷机神经网络初探(上)
小朋友都能懂的人工智能②卷机神经网络初探(中)
小朋友都能懂的人工智能②卷机神经网络初探(下)
小朋友都能懂的人工智能⓷ -惊世骇俗的阿“狗”故事(上)
「08 抛弃束缚,能力全面飙升」
L:2017年10月,Google推出了AlphaGo Zero,该版本仅依靠自我对弈,无需任何人类棋谱,从零开始自学围棋,仅经过3天的训练…你们猜发生了什么?
众人摇头。
L:仅训练3天的AlphaGo Zero,便以100:0 击败了AlphaGo Lee。
A:3天?100比0?是那个击败李世石的AlphaGo Lee吗?
L:是的。
A:我的天啦!
A爸:L老师,您说AlphaGo Zero依靠自我对弈,无需任何人类棋谱,那就是说AlphaGo Lee和AlphaGo Master有依靠人类棋谱,是吗?
L:是的,AlphaGo Lee主要是依赖人类棋谱进行训练的,研发团队为其输入了3000万张人类高手的棋谱进行训练;而AlphaGo Master虽然在前期的训练中也使用人类棋谱,但后期更多的是依赖自我对弈强化学习来提升水平的,对人类棋谱的依赖较小;而AlphaGo Zero则是完全摆脱了人类棋谱的依赖。
A爸:我算是看明白了,哪个版本对人类棋谱的依赖性越强,哪个版本的实力就越弱。这么说,AlphaGo的进步是被人类给耽搁了啊。
众人大笑。
L:是的,A爸说得有道理。咱们接着往下,又有大招了。
众人瞪大了眼睛。
L:受到AlphaGo Zero成功的鼓舞和启发,Google推出了AlphaZero,大家观察一下,这个名字有什么特别之处吗?
C:没有了Go。
L:是的,小C观察得很仔细。这个版本厉害了,Go就是围棋的意思,没有了Go ,就表示不只是围棋。AlphaZero可以同时支持围棋、国际象棋、将棋等多个棋类游戏,展现了此方法的广泛适用性和强大通用性。不仅如此,更为可怕的是其超强的能力。
C:到底有多强呢?
L:围棋能力自不用说了,在国际象棋中AlphaZero仅训练4小时就超越了世界冠军程序Stockfish;在日本将棋中,仅训练2小时就超越了世界冠军程序Elmo。AlphaZero再度惊艳全球,2018年12月7日,登上了当年Science杂志的封面。《科学》杂志评价称,通过单一算法就能够解决多个复杂问题,是创建通用的机器学习系统、解决实际问题的重要一步。
C妈:妈呀,4小时,2小时,分别打败不同领域的最强者,难以想象!
L:是难以想象,AlphaGo不仅抛弃了人类棋谱,还跨越了围棋本身,在消除人类知识的束缚后,变得越来越强!不过,接下来还有更让你们难以置信的事的发生,终!极!大!招!来!了!
众人:啊…
未完待续…
小朋友都能懂的人工智能⓷ -惊世骇俗的阿“狗”故事(下)
系列回顾