目录
5.1.1 行为克隆 (Behavior Cloning, BC)
5.3.4 GAIL(Generative Adversarial Imitation Learning)实现
前置要求
- Python ≥ 3.9, PyTorch ≥ 1.13, Gym ≥ 0.26,建议使用 GPU。
- 熟悉强化学习基本概念(策略、价值函数、损失等)。
- 具备基础的 OpenAI Gym 环境使用经验。
5.1 模仿学习基础
5.1.1 行为克隆 (Behavior Cloning, BC)
| 特点 | 说明 |
|---|---|
| 监督式 | 直接把专家演示映射到动作标签,等价于多分类/回归问题。 |
订阅专栏 解锁全文
1101

被折叠的 条评论
为什么被折叠?



