模糊粗糙数据挖掘与含缺失值信息表的双重粗糙近似
1. 模糊粗糙数据挖掘
1.1 模糊粗糙最近邻分类问题及解决方法
传统的模糊神经网络(FNN)算法在进行预测时,对各个决策类的预测隶属度之和总是需要为 1,这使得难以做出明确的预测。为解决此问题,Sarkar 引入了模糊粗糙所有权函数,将其插入传统 FNN 算法中,可产生不一定总和为 1 的类置信值,但该方法未涉及粗糙集理论的主要成分,即上下近似。
而模糊粗糙最近邻(FRNN)是另一种方法,它利用测试对象的最近邻来构建每个决策类的上下近似,然后计算测试对象对这些近似的隶属度。该方法非常灵活,有多种定义模糊粗糙近似的选项,包括传统的基于蕴含算子/ t - 范数的模型,以及在存在噪声数据时更稳健的模糊量化粗糙集模型。
1.2 混合模糊规则归纳
特征选择通常作为分类的预处理步骤,通过选择与决策最相关的条件属性,消除冗余和/或误导性的属性,来简化决策系统。
在粗糙集理论中,常见的策略是通过将决策约简覆盖在原始(训练)决策系统上并读取值来诱导规则。即通过决策约简中的特征对论域进行划分,每个得到的等价类形成一个单一规则。使用约简可确保每个等价类是决策概念的子集或等于决策概念,意味着产生该等价类的属性值是决策概念的良好预测因子,且每个对象都被规则集覆盖。然而,这种方法生成的规则往往过于具体,因为每个规则前件总是包含最终约简中出现的每个特征。
因此,规则归纳步骤可直接集成到特征选择过程中,实时生成规则。具体而言,用于子集搜索的贪婪爬山算法可用于在每一步生成以最少属性最大程度覆盖训练对象的模糊规则。为了结合规则归纳和特征选择,规则由模糊容差类(前件)和相应的决策概
超级会员免费看
订阅专栏 解锁全文
1171

被折叠的 条评论
为什么被折叠?



