基于语法的遗传编程在规则归纳算法设计中的应用与性能评估
1. 引言
在规则归纳算法的设计中,有一种进化方法备受关注,它能通过Grammar-based Genetic Programming(GGP)系统自动生成规则归纳算法。该系统可依据不同的训练数据集,采用两种不同的方法来设计规则归纳算法:
- 设计能在多个不同应用领域的数据集上都表现良好的鲁棒规则归纳算法。
- 设计针对特定单一数据集的规则归纳算法。
2. GGP系统概述
GGP系统主要包含以下几个关键组件:
- 语法 :包含了许多知名规则归纳算法中已实现的组件,以及一些此前未尝试过但可能在规则归纳算法中发挥良好作用的元素。
- 个体表示 :个体对规则归纳算法进行编码,由语法中的一组产生式规则生成的推导树来表示。
- 种群初始化过程 :考虑了一组约束条件,以避免生成无效个体。这些约束在交叉和变异操作中同样适用。
- 个体评估程序 :使用元训练集(一组数据集)对个体进行评估,针对元训练集中的每个数据集,可获得分类准确率和规则集或列表。
- 交叉和变异算子 :在操作过程中遵循与种群初始化相同的约束,确保生成的个体符合语法要求。
GGP系统在选择传递到下一代的个体时,可采用单目标方法或多目标方法(基于帕累托最优概念)。单目标方法仅旨在最大化分类准确率,而多目标方法则既追求最大化分类准确率,又力求最小化分类模型的规模。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



