信息表缺失值处理与广义粗糙集模型
在信息系统中,数据缺失和不确定性处理一直是重要的研究课题。本文将介绍两种相关的研究成果,一是关于信息表中缺失值的粗糙近似处理方法,二是基于广义基本集分配的粗糙集模型。
信息表缺失值的粗糙近似处理
在信息表中,常常会出现属性值缺失的情况。为了处理这种情况,有人提出了可能等价类的方法来获取具有缺失值的任意属性集之间的粗糙近似。
这种方法的核心在于扩展了可能等价类的概念,不仅考虑了可能性,还引入了确定性的概念。由于在不完全信息下无法得到唯一的粗糙近似,因此得到了对偶的粗糙近似,即确定粗糙近似和可能粗糙近似,实际的粗糙近似介于这两者之间。
该方法与可能世界方法得到的结果相同,确定粗糙近似和可能粗糙近似分别等于所有可能表中粗糙近似的交集和并集,这也证明了可能等价类方法的合理性。而且,该方法不受缺失值仅出现在某些指定属性上的限制,因此可以用于获取具有缺失值的任意属性集之间的粗糙近似。
基于广义基本集分配的粗糙集模型
粗糙集理论是处理信息系统中不确定性的有用工具,但经典的Pawlak粗糙集模型中,等价关系的条件较为严格,限制了其应用范围。因此,一些学者对其进行了扩展,提出了基于任意二元关系的粗糙集模型。
Pawlak粗糙集回顾
Pawlak粗糙集模型中,宇宙中的对象之间的联系由不可区分关系表示。不可区分关系、下近似和上近似是该模型的关键概念。宇宙的知识由等价关系描述,等价类是宇宙的基本知识,被称为原子或基本集。基本集的并集称为可定义集,所有可定义集构成一个σ - 代数,表示宇宙的总基本知识。
对于集合$X⊆U$,其下近似和上近似分别定
超级会员免费看
订阅专栏 解锁全文
28

被折叠的 条评论
为什么被折叠?



