11、自主迷宫导航实验详解

自主迷宫导航实验详解

1. 代理记录可视化

在神经进化过程中收集所有代理的评估记录后,我们希望将这些记录数据可视化,以深入了解其性能。可视化应包含所有求解代理的最终位置,并允许设置物种适应度的阈值,从而控制哪些物种会被添加到相应的绘图中。我们决定将收集的代理记录呈现在上下两个绘图中。上方绘图展示适应度得分大于或等于指定适应度阈值的物种的代理记录,下方绘图则展示其余记录。

代理记录的可视化在 visualize.py 脚本的新方法中实现。相关函数定义可查看 visualize.py 中的 draw_maze_records(maze_env, records, best_threshold=0.8, filename=None, view=False, show_axes=False, width=400, height=400)

2. 基于适应度分数的目标函数定义

本实验使用面向目标的目标函数来引导进化过程,以创建成功的迷宫求解代理。该目标函数基于对迷宫求解器适应度分数的估计,通过测量其在执行 400 步模拟后最终位置与迷宫出口之间的距离来确定。因此,目标函数是面向目标的,完全取决于实验的最终目标:到达迷宫出口区域。

目标函数的确定步骤如下:
- 首先定义损失函数为代理在模拟结束时的最终位置与迷宫出口位置之间的欧几里得距离。在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值