- 博客(2)
- 收藏
- 关注
原创 FP-Growth
由于Apriori方法的瓶颈在于候选集的生成和测试。如果能够避免生成大量的候选集合,那么挖掘性能将得到极大的提高。为此从三个方面解决这个问题。 第一,FP-tree它是一种扩展的前x-tree结构,存储关于频繁模式的关键定量信息。只有频繁出现的长度为1的项目才会在树中有节点,而树节点的排列方式使得频繁出现的节点比不频繁出现的节点有更好的机会共享节点。其次,开发了一种基于FP-tree的模式片段增长挖掘方法,它从一个频繁的长度为1的模式(作为初始后缀模式...
2022-02-09 10:26:24
481
原创 Apriori算法
1.问题描述是一个文字集合,称作项集,D是一个事务集合,其中每个事务T是一个项目集合。与每个事务相关联的是一个唯一的标识符,称为TID。如果X属于T,则一个事务T包含X(I中的一些项的集合)。关联规则的形式是如果在D中包含X的事务中有c%的事务也包含Y,则规则X => Y在事务集D中具有可信度c。如果在D中s%的事务包含X并Y,则规则X => Y在事务集D中具有支持度s。项集:项的集合,项可以是商品,那么项集就是商品的集合。 支持度:数据集中包含该项集的记录所占的比例,也就是该
2022-01-10 11:37:19
1450
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅