
数据挖掘
你倒是敲代码啊.
韶光易逝,劝君惜取少年时。
展开
-
关联规则挖掘——FPTree
FPTree 前面介绍过用Aprior算法来挖掘关联规则,但是Aprior算法的最大缺陷就是生成了候选项集,通过求组合数可以知道候选项集的数量是非常庞大的。 从候选项集到频繁项集,需要不断地扫描整个数据库来计算支持度是否满足min_sup的要求。 因此为了消除这种“候选产生过程”,频繁增长模式(Frequent-Pattern Growth,FP-Growth)产生了。 算法思想 采用分治策略 首先,将代表频繁项集的数据库压缩到一颗频繁模式树(FP-Tree),该树仍然保留项集的关联信息。 然后,把这原创 2020-11-30 22:50:17 · 909 阅读 · 0 评论 -
Aprior算法
什么是Aprior算法 Aprior算法是用来挖掘关联规则的算法 什么是关联规则 关联规则是形如X→Y的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) 。其中,关联规则XY,存在支持度(support)和信任度(confidence). support(X=>Y)=P(X∪Y). confidence(X=>Y)=P(Y|X)=P(XY)P(X)\frac原创 2020-11-18 16:24:47 · 820 阅读 · 0 评论