强化学习-Reinforcement learning
参考:
什么是强化学习?
强化学习并不是某一种特定的算法,而是一类算法的统称。如果用来做对比的话,他跟监督学习,无监督学习 是类似的,是一种统称的学习方式。
强化学习算法的思路非常简单,以游戏为例,如果在游戏中采取某种策略可以取得较高的得分,那么就进一步「强化」这种策略,以期继续取得较好的结果。这种策略与日常生活中的各种「绩效奖励」非常类似。我们平时也常常用这样的策略来提高自己的游戏水平。
强化学习和监督学习、无监督学习 最大的不同就是不需要大量的“数据喂养”,而是通过自己不停的尝试来学会某些技能。
入门:
【强化学习】从强化学习基础概念开始(2019-6)
「教程」深度学习、强化学习进阶课程(YouTube视频,需要科学上网)