遗传编程在分类与算法设计中的应用
1. 分类中GP树与决策树的差异
在分类任务中,GP树和决策树作为分类函数存在明显差异。
- 结构差异 :当使用GP树作为分类函数时,预测属性位于叶节点,类别通常不出现在代表个体的树中,新示例的类别分配取决于个体决策树根节点返回的值;而决策树中,内部节点与基于单个属性值的测试(单变量测试)相关联。
- 分类方式差异 :决策树对新示例的分类是自上而下进行的,先将示例呈现给根节点,然后将示例向下传递直到到达叶节点并做出相应的类别预测;而传统GP树对新示例的分类是自下而上进行的,通过将个体叶节点的属性用示例中的对应值实例化,并将信息向上传播,直到根节点输出一个值并转换为预测类别。
此外,进化决策树的GP算法可进一步细分为两类:一类是进化的决策树内部节点仅包含单变量测试;另一类是内部节点包含多变量测试。单变量测试是传统决策树中常见的方式,多数用于进化决策树的GP算法产生的决策树仅包含此类单变量测试。多变量测试虽然表达能力更强,更能处理属性交互,但由于其复杂性,导致生成的树用户理解难度增加,且搜索每个节点的最佳属性测试所需的计算时间也会增加,因此使用频率相对较低。
2. 规则归纳算法组件的进化
规则归纳算法主要由几个主要组件构成,包括候选规则的表示、探索候选规则空间的搜索策略以及衡量候选规则质量的评估函数。
有人提出了基于语法的GP系统来进化规则归纳算法的评估函数,该系统实现了分类算法部分设计的自动化。以基于归纳逻辑编程(ILP)的规则归纳算法为例,多数组件在实验中是固定的,如采用一阶逻辑表示,搜索策略使用自上而下的规
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



