基于不可区分关系描述不完整信息表中的粗糙近似
1. 引言
在现实生活中,不完整信息的情况十分常见。例如,当我们得到“John的年龄大约是20岁”这样的不完整信息时,“大约20岁”可以用集合{19, 20, 21}来表示,实际年龄就在这个集合中,但在没有额外信息的情况下,我们无法确定具体是哪个值。
粗糙集框架是数据科学中的有效工具,广泛应用于数据分析、模式识别、机器学习和数据挖掘等领域。其基础是对象特征值的不可区分性,核心是由下近似和上近似组成的粗糙近似。传统的粗糙近似通常从包含完整信息的信息表中的不可区分关系得到的等价类之间的包含和交集关系推导而来。
为了处理不完整信息,对原始粗糙近似进行了一些扩展。然而,一些方法只考虑了缺失值可能等于另一个值的可能性,导致粗糙近似结果不佳,并且与基于Lipski的方法在可能世界语义下的结果不同。
一个缺失值有两种可能性:可能等于另一个值,也可能不等于该值。在没有额外信息的情况下,无法确定哪种可能性成立。Nakata和Sakai基于可能等价类开发了一种方法,但该方法在获取可能等价类时存在局限性。
为了消除这种局限性,我们将展示一种直接使用不可区分关系,而不是从不可区分关系中获得的等价类的方法。这种方法适用于各种类型的信息,本文将其应用于用值集合表示的不完整信息。我们将从确定性和可能性的角度来制定粗糙近似和规则归纳,以处理包含存在但未知类型缺失值的不完整信息。
2. 完整信息系统中基于不可区分关系的粗糙集
2.1 完整信息系统的数学模型
一个数据集可以用信息表表示,其中每行代表一个对象,每列代表一个属性。具有完整信息的信息表的数学模型称为完整
超级会员免费看
订阅专栏 解锁全文
36

被折叠的 条评论
为什么被折叠?



