强化学习

强化学习概览

强化学习(Reinforcement learning,简称RL)是机器学习的子领域,涉及决策制定和控制问题。

强化学习需要解决的问题是如何使一个智能体在复杂和不确定性的环境中学会完成目标任务(获得最大奖励)。

 

强化学习非常通用,用于解决所有涉及做出一系列决策的问题。强化学习甚至可以用于具有序列输出或结构化输出的有监督学习问题。

 

强化学习已经开始在许多困难的环境下获得成功。强化学习具有很长的研究历史,但是直到最近深度学习取得突破性进展前,它还需要许多特定于问题的工程。

DeepMind’s Atari resultsBRETT from Pieter Abbeel’s group, and AlphaGo 均使用强化学习算法。他们没有对环境做太多的假设,因此可以应用于其他设置。

 

转载于:https://www.cnblogs.com/jiangkejie/p/10844647.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值