
数据挖掘
monsion
这个作者很懒,什么都没留下…
展开
-
Apriori算法简介及其用C++模拟实现
原文链接:http://blog.youkuaiyun.com/qq675927952/article/details/6707704 http://blog.youkuaiyun.com/pupingpp/article/details/8264734 关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析 (market basketanalysis)。例如,购买鞋的顾客,有10%的可能转载 2013-04-07 16:58:54 · 9886 阅读 · 2 评论 -
FP-Tree算法的实现
FP-Tree算法的实现 在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支,韩嘉炜老师的FP-Tree算法就是其中非常高效的一种。 支持度和置信度 严格地说Apriori和FP-Tree都是寻找频繁项集的算法,频繁项集就是所谓的“支持度”比较高的项集,下面解释一下支持度和置信度的概转载 2013-04-08 21:31:57 · 3010 阅读 · 0 评论 -
FP树构造
FP Growth算法利用了巧妙的数据结构,大大降低了Aproir挖掘算法的代价,他不需要不断得生成候选项目队列和不断得扫描整个数据库进行比对。为了达到这样的效果,它采用了一种简洁的数据结构,叫做frequent-pattern tree(频繁模式树)。下面就详细谈谈如何构造这个树,举例是最好的方法。请看下面这个例子: 这张表描述了一张商品交易清单,abcdefg代表商品,(转载 2013-04-09 09:02:21 · 12936 阅读 · 2 评论