基于语法的遗传编程自动设计规则归纳算法
1. 引言
长期以来,进化算法被用于进化规则集,作为一种分类模型。研究人员从基于规则的分类模型,转向进化数据挖掘算法的组件,如今甚至可以进一步进化完整的规则归纳算法。这里介绍一种基于语法的遗传编程(GGP)系统,用于自动进化规则归纳算法。该系统可生成鲁棒的规则归纳算法,或针对特定应用领域(数据集)定制性能的算法,生成的规则归纳算法类型仅取决于训练GGP系统的数据。
GGP系统有两种主要方法,这里采用的是解决方案编码个体方法,即使用语法创建GGP系统初始种群中的个体,而非参与基因型 - 表型映射过程(生产规则序列编码个体方法)。
1.1 GGP系统流程
- 个体构建 :语法包含规则归纳算法基本结构的背景知识,每个个体代表一个新的规则归纳算法,通过遵循语法的一组推导步骤构建。
- 评估 :使用一组名为元训练集的数据集评估个体(规则归纳算法),根据规则归纳算法在所有数据集上的分类准确率生成个体的适应度函数值。
- 选择与操作 :采用精英繁殖策略选择适应度值最佳的个体并直接传递到新种群,再使用锦标赛选择方案(k = 2)选择个体,获胜者根据用户定义的比率进行繁殖、变异或交叉操作。
- 终止与测试 :进化过程持续到达到最大代数,最后选择适应度最高的个体作为解决方案,并在名为元测试集的新数据集上进行评估。
需要强调的是,目前没有显著研究表明解决方案编码个体方法和生产规则序列编码
超级会员免费看
订阅专栏 解锁全文
45

被折叠的 条评论
为什么被折叠?



