规则归纳算法的自动化设计
1. 规则归纳算法的预处理与后处理
规则归纳算法在设计过程中,有重要的预处理和后处理阶段。在预处理阶段,有三种去除规则前件条件的方法:
- 一次移除一个条件(1Cond),只要新规则根据评估标准比原规则更好。
- 移除最后添加的条件(LastCond)。
- 从规则前件末尾移除一系列条件(FinalSeqCond),同样需新规则比原规则更优。
在这个阶段,规则的评估使用与构建规则不同的数据集。
规则创建过程通常持续到训练集中的大部分或所有示例都被生成的规则覆盖。不过,当非终结符 RuleStoppingCriterion 定义的条件不满足时,规则创建过程也会停止,这个条件通常基于最后找到的规则的某种属性,例如检查刚生成规则的准确率(置信度)是否大于阈值,常用阈值为 0.5、0.6 和 0.7。
规则集或列表完成后,算法还可进行后处理操作。后处理步骤的存在由非终结符 NT 1 的应用决定。后处理方法(NT 25)可将预剪枝单个规则的技术应用于规则模型中的所有规则。具体操作如下表所示:
| 操作类型 | 操作内容 |
| ---- | ---- |
| 移除条件 | 完成模型后,可从规则前件一次移除一个(1Cond)或两个(2Cond)条件。对于规则集,只要新规则根据评估标准比原规则好,模型就会简化;对于规则列表,此过程在不降低整个模型准确率的情况下进行。也可选择移除规则末尾的一系列条件。 |
| 移除规则 | 通过移除当前模型中的整个规则来尝试更紧凑的模型,每次移除规则后,需使用终端 EvaluateModel 重新评估整个模型。后处理的规则或规则集同样在与构建数据不同的数据集
超级会员免费看
订阅专栏 解锁全文
2983

被折叠的 条评论
为什么被折叠?



