第七课:强化学习基础
1. 强化学习简介
强化学习(Reinforcement Learning, RL)是人工智能的一个重要分支,涉及智能体(agent)通过与环境(environment)的互动来学习如何做出决策。与监督学习和无监督学习不同,强化学习的目标是学习一个策略(policy),用以在给定状态下选择最优动作,以最大化累计奖励。
2. 强化学习的关键要素
- 智能体(Agent):做出决策的实体。
- 环境(Environment):智能体所处并与之互动的外部世界。
- 状态(State):环境在特定时间点的描述。
- 动作(Action):智能体在特定状态下可以选择的行为。
- 奖励(Reward):智能体因采取特定动作而从环境中获得的反馈。