深度神经进化:Atari游戏实验与可视化
1. 实验配置
实验运行器接收JSON文件中定义的实验配置,并针对指定数量的游戏时间步长运行神经进化过程。以Frostbite游戏为例,评估在达到15亿个时间步后停止。以下是实验配置文件的内容:
{
"game": "frostbite",
"model": "LargeModel",
"num_validation_episodes": 30,
"num_test_episodes": 200,
"population_size": 1000,
"episode_cutoff_mode": 5000,
"timesteps": 1.5e9,
"validation_threshold": 10,
"mutation_power": 0.002,
"selection_threshold": 20
}
各配置参数说明如下:
| 参数 | 说明 |
| ---- | ---- |
| game | ALE中注册的游戏名称,支持的游戏列表可在 此处 查看 |
| model | 用于构建控制器ANN的网络图形模型名称,模型定义在
超级会员免费看
订阅专栏 解锁全文
1092

被折叠的 条评论
为什么被折叠?



