8、分布式数据中条件函数依赖的非恒定CFDps发现与模式表生成

分布式数据中条件函数依赖的非恒定CFDps发现与模式表生成

1. 非恒定CFDps发现相关内容

在数据处理领域,非恒定条件函数依赖模式(CFDps)的发现是一个重要的研究方向。目前,尚未有已发表的专门用于发现非恒定CFDps的算法。不过,CFDps与近似函数依赖存在一些相似之处,二者都是在排除部分元组的情况下依赖关系成立。但不同的是,寻找CFDp需要识别模式表中的目标条件,而对于近似依赖,只需确定不满足依赖关系的元组数量即可。

过去已经提出了许多用于发现函数依赖(FDs)和条件函数依赖(CFDs)的算法。例如,用于发现传统FDs的算法有TANE、Dep - miner、Fast - FD、FD Mine等;用于发现一般CFDs的算法包括基于属性格搜索策略的算法、受Fast - FD算法启发的Fast - CFD、扩展TANE算法的CTANE以及同样基于TANE算法扩展的CFD - Mine等。此外,还有一些专门用于发现恒定CFDs的算法,如基于挖掘闭项集技术的CFDMiner等。

有一个用于从数据集中发现非恒定CFDps的算法,其目标是识别满足特定要求的非恒定CFDps子集,而不是专门针对已有专用算法的CFDs。该算法的实现方式是选择不满足依赖关系的元组,并利用这些元组的属性值构建目标条件,以获得有效的依赖关系。

在UCI机器学习库的数据集上进行的首次算法测试结果表明,算法生成的CFDps数量会因输入参数的值、关系中的属性和元组数量以及数据类型的不同而有很大差异。当从数据集中检索到过多的CFDps时,可以通过调整输入参数(特别是depSupport和maxSizeLHS参数)来减少识别出的依赖关系数量。较高的depSupport参数值有助于识别在数据质量方面最

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值