强化学习与深度强化学习入门
1. 强化学习简介
强化学习是一种让智能体(agents)解决复杂问题的方法。在很多情况下,我们无需构建环境,而是可以接入现有的环境,例如游戏引擎或其他 API。OpenAI 发布的 Python Gym 库就提供了许多环境,并且为学习算法与环境的交互提供了简单的接口。以下是使用 Gym 库启动一个赛车游戏的代码示例:
import gym
env = gym.make('CarRacing-v0')
env.reset()
env.step(action)
env.render()
通过这几行代码,我们就可以加载并运行一个赛车游戏,展示了 Gym 库的便捷性。
2. 强化学习的应用
2.1 通用学习算法的需求
普通的监督式机器学习算法,如图像分类器,虽然取得了一些重要且有用的成果,但无法引领我们实现通用人工智能(AGI)。我们最终追求的是通用学习机器,它能在最少甚至无需监督的情况下应用于多个问题,并且其技能可以跨领域迁移。大型数据丰富的公司可以从监督式方法中获益,但小型公司和组织可能没有资源充分利用机器学习的力量。而强化学习目前是实现通用学习算法最有前途的方法。
2.2 强化学习的成功案例
- 游戏领域 :
- Atari 游戏 :2013 年,Google 的 DeepMind 研究小组开发的算法能够以超人水平玩多种 Atari 游戏。之前尝试解决
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



