Outlier Detection Based on Fuzzy Rough Granules in Mixed Attribute Data
邻域系统中基于多粒度相对熵的混合属性离群点检测
Abstract
离群点检测是数据挖掘的重要研究方向之一。然而,目前的研究大多集中在分类或数值属性数据的离群点检测上。关于混合属性数据离群点检测的研究很少。在本文中,我们引入模糊粗糙集(FRS)来处理混合属性数据中的离群点检测问题。由于经典粗糙集的离群点检测模型仅适用于分类属性数据,因此我们使用FRS对离群点检测模型进行了推广,构建了基于模糊粗糙粒的广义离群点检测模型。首先,定义颗粒离群度(GOD),利用模糊逼近精度表征模糊粗糙颗粒的离群度。然后,通过将GOD和相应的权重相结合,构造基于模糊粗糙粒子的离群因子来表征对象的离群程度。此外,还设计了相应的基于模糊粗糙粒子的离群点检测(FRGOD)算法。通过对16个真实数据集的实验,评估了FRGOD算法的有效性。实验结果表明,该算法对异常值的检测更加