动态遗传编程适应度案例的使用探索
1. 相关工作
1.1 遗传编程中的适应度案例
在遗传编程(GP)里,个体的适应度通常借助一组适应度案例来计算,而且适应度案例的使用方式极为关键。适应度案例的规模大小不一,有的问题仅需少量适应度案例,而有的则多达数万。
确定GP系统所需适应度案例数量的方法有多种。比如,理性试验分配算法是个不错的选择。在新一代产生之前,仅用系统可用适应度案例的一部分来评估个体;当个体有机会在某个选择机制(如锦标赛选择)中获胜却失败时,再在新的适应度案例上进一步评估。
另一种方法基于统计学和信息论,像中心极限定理和随机变量的熵。研究人员在离散适应度值案例上测试了该理论框架,结果表明其估计与实验结果相符。当GP系统使用的适应度案例数量至少达到该方法的估计值时,系统能取得可靠结果;反之则不然。
若适应度案例数量众多,就需采用某种机制来确定使用的案例数量和具体案例。以下是一些已提出的方法:
- 基于拓扑的机制 :依据个体对适应度案例的解决情况,促进对某些案例的使用。
- 历史子集选择 :根据精英个体对适应度案例的解决能力,选取部分案例。
- 主动数据选择 :使用小训练案例集,在搜索过程中,将这些子集重新组合,并从整个集合中选取少量适应度案例进行扩充。
此外,还有一些采样方法,如交错采样和随机交错采样,在某些代使用单个适应度案例,在其他代使用整个训练集。最近提出的字典序选择算法,在每次亲代选择时随机打乱适应度案例,保留在第一个适应度案例上表现最佳的个体,该方法扩展到实值
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



