MADDPG—建立自己的游戏环境（二）

最新推荐文章于 2025-05-12 23:19:37 发布

大鱼治不了水

最新推荐文章于 2025-05-12 23:19:37 发布

阅读量2.3k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：技能学习中文章标签：深度学习强化学习

6 篇文章

订阅专栏

本文介绍MADDPG代码中的命令行选项，包括环境设置、训练参数、数据保存及测试等方面。提供了详细的参数说明及其默认值，帮助读者更好地理解和调整训练过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

MADDPG代码中的命令行选项

--restore: 恢复先前存储在 load-dir 中的训练状态（如果没有 load-dir，则在 save-dir 中）
已提供），并继续训练 (默认值: False)
--display: 在屏幕上显示存储在 load-dir 中的训练策略（如果没有 load-dir，则在 save-dir 中）
已提供），但不继续训练(默认值: False)
--benchmark: 对保存的策略运行基准评估（也就是会对策略进行测试，评估策略的好坏），将结果保存到“benchmark-dir”文件夹 (默认值: False)
--benchmark-iters: 每经过多少轮迭代进行一次基准测试 (默认值: 100000)
--benchmark-dir: 保存基准数据的目录 (默认值: "./benchmark_files/")
--plots-dir: 保存训练曲线 (默认值: "./learning_curves/")