前言
本文主要阐述了用粗糙集理论进行规则提取的一种方法,若之前不了解粗糙集的,请参考这篇博客:http://blog.sina.cn/dpool/blog/s/blog_65aba7b70100h5s0.html。它以条件属性子集的分类一致性来度量属性的重要性, 并逐步加入重要的属性. 算法中设计了一个规则约简过程, 用来简化所获得的规则, 增强规则的泛化能力。
定义
信息表就是一个一组对象的信息的二维表格,纵轴我们表示对象的个体,横轴我们表示对象的各个属性。比如:
信息表 | a | b | c |
---|---|---|---|
x1 | 0 | 0 | 0 |
x2 | 0 | 0 | 1 |
x3 | 0 | 1 | 0 |
以上就是一个信息表,表示了不同对象在不同属性的取值。
定义1:描述子就是诸如a = 0,或 c = 1这样的等式,即描述了一个属性域上一个确切的值。
决策表其实就是信息表上对每一个对象加上一个分类的知识或者是标记,表明该对象属于某一个分类,具体事例如下:
决策表 | a | b | c |
---|