Super-mario-bros-PPO-pytorch 项目教程

最新推荐文章于 2024-12-02 16:14:22 发布

原创最新推荐文章于 2024-12-02 16:14:22 发布 · 647 阅读

CC 4.0 BY-SA版权

Super-mario-bros-PPO-pytorch 项目教程

Super-mario-bros-PPO-pytorchProximal Policy Optimization (PPO) algorithm for Super Mario Bros项目地址:https://gitcode.com/gh_mirrors/su/Super-mario-bros-PPO-pytorch

项目介绍

Super-mario-bros-PPO-pytorch 是一个基于 PyTorch 实现的项目，使用 Proximal Policy Optimization (PPO) 算法训练智能体玩超级马里奥兄弟游戏。该项目由 uvipen 开发，遵循 MIT 许可证。PPO 算法是由 OpenAI 提出的，用于训练 OpenAI Five，这是第一个在电子竞技游戏中击败世界冠军的 AI。

项目快速启动

安装依赖

首先，确保你已经安装了 Python 和 PyTorch。然后，克隆项目仓库并安装必要的依赖：

git clone https://github.com/uvipen/Super-mario-bros-PPO-pytorch.git
cd Super-mario-bros-PPO-pytorch
pip install -r requirements.txt

训练模型

通过以下命令启动训练：

python train.py --game=SuperMarioBros-Nes

预测

使用训练好的模型进行预测：

python infer.py --game=SuperMarioBros-Nes

应用案例和最佳实践

应用案例

该项目的主要应用是训练智能体玩超级马里奥兄弟游戏。通过 PPO 算法，智能体能够完成 31/32 关卡，表现优于人类玩家。

最佳实践

调整动作空间：为了使模型更好地拟合，可以调整游戏可执行的动作。动作定义在 actions.py 文件中。
使用预训练模型：项目提供了预训练模型，可以直接下载使用，节省训练时间。

Super-mario-bros-PPO-pytorch 项目教程

Super-mario-bros-PPO-pytorch 项目教程

项目介绍

项目快速启动

安装依赖

训练模型

预测

应用案例和最佳实践

应用案例

最佳实践

典型生态项目

相关项目