进化与采样适应度函数
1. 引言
在进化计算领域,许多应用涉及从适应度函数的部分采样中获取适应度数据。适应度的确定可以通过部分采样的显式数学函数或某种环境来完成,该环境为由基因型的表型表示产生的实体执行的不同行为提供性能信息。对于每个个体和适应度的确定,所使用的数据是不同的,尽管它们是同一函数的一部分。因此,如果所需的最优个体必须在整个适应度函数中实现最优,那么获得它意味着需要整合一系列适应度函数的部分快照。这些快照取决于进化过程如何呈现关于适应度的信息。
如果我们把这个翻译成一个更正式的计算环境,我们面临的问题是通过展示一系列部分数据样本或帧来获得某种类型函数的一般表示。传统的解决方法是等待足够多的帧被编译好,然后使用全部信息来获得表示。在代理-环境交互的情况下,每个代理都会被要求与环境进行非常长时间的交互。当有一个简单且静态的过程,不随我们收集信息的时间长短而改变,且必须考虑的相关数据可以在合理的时间内被收集和存储时,这一切都是如此美好。
当我们处理复杂动态过程时,它表现得并不好。在这种情况下,使用接近完全信息的适应度函数进行进化在计算上变得非常昂贵,实际上,它变得无法实现。
2. 我们的问题
我们考虑的问题是通过自主机器人与世界(无论是真实世界还是模拟世界)的在线互动来获得世界和内部模型。代理在任何给定时刻从环境中接收的信息是部分的,并且在许多情况下,是有噪声的或不相关的。它从这种瞬时信息中提取的任何模型,在大多数情况下,对于其他时刻将是无用的。为了概括适当的模型,代理将不得不考虑并关联在许多不同的时刻获得的信息,以一种高效的方式。
在更数学的术语中,并考虑到一组定义函数的数据,模型的适应度由它如何适应整个函数
超级会员免费看
订阅专栏 解锁全文
1479

被折叠的 条评论
为什么被折叠?



