自主迷宫导航实验详解
1. 代理记录可视化
在神经进化过程中收集所有代理的评估记录后,我们希望将这些记录数据可视化,以深入了解其性能。可视化应包含所有求解代理的最终位置,并允许设置物种适应度的阈值,从而控制哪些物种会被添加到相应的绘图中。我们决定将收集的代理记录呈现在上下两个绘图中。上方绘图展示适应度得分大于或等于指定适应度阈值的物种的代理记录,下方绘图则展示其余记录。
代理记录的可视化在 visualize.py 脚本的新方法中实现。相关函数定义可查看 visualize.py 中的 draw_maze_records(maze_env, records, best_threshold=0.8, filename=None, view=False, show_axes=False, width=400, height=400) 。
2. 基于适应度分数的目标函数定义
本实验使用面向目标的目标函数来引导进化过程,以创建成功的迷宫求解代理。该目标函数基于对迷宫求解器适应度分数的估计,通过测量其在执行 400 步模拟后最终位置与迷宫出口之间的距离来确定。因此,目标函数是面向目标的,完全取决于实验的最终目标:到达迷宫出口区域。
目标函数的确定步骤如下:
- 首先定义损失函数为代理在模拟结束时的最终位置与迷宫出口位置之间的欧几里得距离。在
超级会员免费看
订阅专栏 解锁全文
744

被折叠的 条评论
为什么被折叠?



