NEAT 算法解决 Lunar Lander 问题:从理论到实践
0. 前言
在使用 NEAT 解决强化学习问题一节所用的方法只适用于较简单的强化学习 (reinforcement learning, RL) 环境。在更复杂的环境中使用同样的进化解决方案,比如 Lunar lander 问题,几乎没有任何进展。这是因为仅通过奖励来进化 NEAT 智能体是不够的。为了解决 Lunar lander 问题,在本节中,介绍改进的 NEAT 求解器。
1. 定义环境
首先,导入所需库,并定义 Gym 环境:
import gym.wrappers
import matplotlib.pyplot as plt
import numpy
订阅专栏 解锁全文
653

被折叠的 条评论
为什么被折叠?



