【Datawhale组队学习深度强化学习】Task3深度学习基础

  本次学习的相关资料:

【教程】

蘑菇书EasyRL

Datawhale

GitHub - datawhalechina/joyrl-book

【学习者手册】

https://mp.weixin.qq.com/s/pwWg0w1DL2C1i_Hs3SZedg

第六章 深度学习基础 (datawhalechina.github.io)

通俗解释:

强化学习与深度学习的关系

强化学习与深度学习都是机器学习的一部分,但它们各自有不同的应用和特点。我们可以用一个比喻来帮助理解它们之间的关系:
想象一下,你是一个正在学习新技能的学生。深度学习可以比作是一种“自学”方式,你需要大量的书籍(数据)来学习。你通过阅读这些书籍,理解其中的内容,并能够回答与这些书籍相关的问题。这种学习方式非常适合于需要识别模式或类别的任务,比如识别图片中的猫或狗,或者翻译一种语言到另一种语言。
强化学习则更像是一种“实践”方式,你通过实际操作来学习。你有一个目标,比如学会骑自行车,但是你没有具体的指导手册,只能通过尝试和错误来学习。每次尝试,你会得到一个反馈:如果你保持平衡,你会得到正面的反馈;如果你摔倒了,你会得到负面的反馈。你根据这些反馈来调整你的行为,以便在下一次尝试中做得更好。强化学习非常适合于需要做出决策序列的任务,比如玩游戏、机器人导航或自动驾驶汽车。
现在,如果我们把深度学习加入到强化学习中,就像是你有一个教练(深度学习)在你实践(强化学习)的时候帮助你。教练会观察你的动作,并根据他的经验给你建议,这些建议可以帮助你更快地学习。这种结合了深度学习的强化学习被称为深度强化学习,它是目前人工

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值