
强化学习
文章平均质量分 91
先有后优07
这个作者很懒,什么都没留下…
展开
-
强化学习笔记之策略梯度PG
策略梯度PG学习原创 2022-07-08 22:10:12 · 882 阅读 · 0 评论 -
强化学习(一)模型基础
强化学习(一)模型基础1.强化学习在机器学习中的位置 强化学习的学习思路和人比较类似,是在实践中学习,比如学习走路,如果摔倒了,那么我们大脑后面会给一个负面的奖励值,说明走的姿势不好。然后我们从摔倒状态中爬起来,如果后面正常走了一步,那么大脑会给一个正面的奖励值,我们会知道这是一个好的走路姿势。那么这个过程和之前讲的机器学习方法有什么区别呢? 强化学习是和监督学习,非监督学习并列的第三种机器学习方法,从下图我们可以看出来。 强化学习来和监督学习最大的区别是它是没有监督学习已经准备好的训转载 2022-03-31 16:48:43 · 1023 阅读 · 0 评论