遗传编程算法详解
1. 遗传编程算法参数
遗传编程(GP)算法的性能受多个参数影响,如代数、交叉和变异率以及个体最大规模。一般而言,这些参数的最优值取决于目标问题,通常在初步实验中确定,这与大多数数据挖掘方法的应用情况类似。
2. 终端和函数集及闭包属性
设计 GP 算法时,一个关键问题是选择终端和函数集中的元素。这些元素的最优选择高度依赖具体问题,但一组通用的小型逻辑和算术函数在许多应用中表现良好。例如,算术和逻辑运算符(如加法、减法、乘法、除法、或、与、异或)可作为函数集的起点,它们能解决的问题范围十分惊人,在分类、机器人控制和符号回归等问题中都有不错的应用。
在选择终端和函数集元素时,设计者需权衡表达能力和计算效率。一方面,集合应包含足够元素以表达优质候选解;另一方面,过多元素会使候选解搜索空间过大,增加找到优质解的难度。
此外,终端和函数必须遵循闭包属性,即函数集里的每个函数都要能处理其输入值(可以是终端或其他函数的输出)。例如,除法运算符需处理除以零的情况,通常可让其在这种情况下返回给定值而非报错。早期 GP 系统受闭包属性限制,只能处理一种数据类型,但新的 GP 系统已在克服这一问题。
在回归和分类这两种数据挖掘任务中,预测属性的数据类型对终端和函数集的设计有重要影响。若所有预测属性数据类型相同,可在函数集中仅使用接收和输出该数据类型的运算符和函数,以满足闭包属性。
- 回归任务 :若预测属性为连续值,可在函数集中包含适合应用领域的数学函数,终端集包含预测属性和随机常数生成器。当给定一个需预测目标属性值的示例时,树状个体的叶子节点会用示例
遗传编程算法详解
超级会员免费看
订阅专栏 解锁全文
10

被折叠的 条评论
为什么被折叠?



